火车采集器获取Cookie不准确、登陆不正常、不能下载附件的解决办法

by 尘缘 on 三月 2nd, 2010 // Filed Under → LocoySpider

使用火车采集器内置的浏览器,能很方便的获取到需要登陆的网站Cookie值,基本上能满足大多数网站的采集需求。

然而,受系统权限和目标网站的验证限制,有一些情况,使用火车采集器内置浏览器获取的Cookie并不准确,或者虽然Cookie值是准确的,却无法正常的模拟登陆,出现一些不能登陆发布内容、不能正常发布附件的情况。造成反复登陆却总是提示没有登陆的错误提示,或者下载附件时,出现下载的附件是一些.php文件的情况。

针对这种情况,尘缘今天做了2010年的第一个视频教程。今天讲的内容,着重分析了问题产生的原因和解决办法,并仔细讲了如何解决不能下载附件的一些解决办法。

希望对大家有用。今天的视频,我依然使用最高清晰度的压制比例,视频文件可能个头比较大,目的是为了让大家看清楚画面上的文字,避免产生误导。

不能正常登陆和不能下载附件,常见于一些论坛附件下载,
主要原因是由于火车采集器模拟的浏览器参数与实际情况不符合。

问题原因
1,火车采集器没有设置或者设置出错,也包括设置的数据已经过期
2,Cookie获取不正确

解决办法
1,选项设置-采集发布设置-本机浏览器User-Agent,重新获取或者使用抓包工具
2,任务-编辑任务-使用抓包工具获取 Cookie
3,将下载链接中的 & 替换为 & ,不含空格

常见的抓包工具及下载
1,WSockExpert数据包抓取工具,http://www.locoy.com/locoy/download/
2,HttpAnalyzerFullV5+keymaker,http://www.boom.im/archives/3/
3,火狐浏览器中的 FireBug 组件,目前版本:Firebug 1.5.2,使用火狐点此可直接安装

HttpAnalyzerFullV5最新版及注册机下载:

最新版:http://www.ieinspector.com/httpanalyzer/downloadV5/full_edition/HttpAnalyzerFullV5.exe
注册机:HttpAnalyzerStdV5_keygen

视频教程下载地址
http://www.4wei.cn/locoy/download_attachment.rar

你可以任意转摘“火车采集器获取Cookie不准确、登陆不正常、不能下载附件的解决办法”,但请保留本文出处和版权信息。
作者:尘缘,QQ:130775,来源:http://www.4wei.cn/archives/1000446

有 10 条评论啦

Posted on 2010年03月4号 at 15:54:29

尘缘 :

视频教程地址已经更新。

Posted on 2010年05月25号 at 09:07:04

joyanhui :

发表文章测试 返回数据为空......

发布信息的时候 全部是失败:状态未知,日志为空.

Posted on 2011年01月8号 at 16:59:33

百科 :

我的新闻发布的时候出现。你请求的来路不正确或表单认证串不符。无法提交

Posted on 2011年01月31号 at 00:04:41

小张 :

多谢 尘缘了 学习到了很多,2011祝您万事如意,财源滚滚!

Posted on 2011年02月27号 at 23:40:07

北京论坛 :

先试试再说

Posted on 2011年03月19号 at 15:57:05

小凡 :

尘缘大哥,我至今还未解决··求指导

如果你按视频教程中的方法做了,基本上能解决目前除PW以外其它所有程序的登陆问题。

Posted on 2011年05月7号 at 13:31:29

castle :

你请求的来路不正确或表单认证串不符

hash字段字段获取不符

Posted on 2011年08月29号 at 11:28:42

求救者 :

尘缘哥。。 我按照视频的那样都做了,我采集也没采集附件一类的,我只是想发表到discuz的论坛上,可是老是显示我未登录,发布配置有个测试,那个测试能发布上,但是到其他地方就不成了,请先登录

提示未登陆的话,一般是Cookie过期或者获取不正确。解决方法:http://www.4wei.cn/archives/1000446

Posted on 2011年09月20号 at 18:36:53

chnj10 :

我是在发布的时候出现这种情况,这方法能解决吗?

Posted on 2011年12月27号 at 12:23:34

爱妆点 :

为何在发布的时候总是提示登录呢?明明登录了啊



走过路过,千万不要飞过,那是鸟人: