Archive for  LocoySpider

全能版接口专用的国内省市随机IP库

发表于 2010-06-6 00:35 : 评论 ( 4 条评论 )

此前开发的全能版采集接口,均使用随机IP生成手段,这个方法生成的IP,可能遍布全球,看起来真实性不高。

针对这个问题,在PHPwind全能版接口中,我增加了一个国内IP随机的功能。这个功能,可以从指定的IP列表中,随机抽取一些国内IP作为用户的活动IP,这样看起来貌似会增加论坛的真实性。

后程序交付客户使用,客户反映效果非常良好。于是,我又将这个功能复制到Discuz!X接口中,并在今天对接口做了升级。

这个IP库是从纯真IP库中,反向剥离出来的,IP数据非常全面。考虑到发布时的实际需求,我将IP库条数限制为了10万条,经过简单压缩,文件大约在2M左右。

下面提供的IP库是我从一些省市中随机生成的,并不针对某一个城市,如果有需要需要特定国家或者地区的IP地址,可以联系我生成。

简单演示:

使用方法:

  1. 下载IP文件列表文件
  2. 解压后上传到论坛的data目录(Dz!X和PW都是data目录,discuz 7.x 在 forumdata)即可
  3. 本文件基于纯真IP库2010-5-31生成
  4. 为了避免资源占用过高,本程序生成的IP地址条数为10万条

点击下载:locoy.ip.rar

Discuz!X采集接口,增加一个随机回复的功能

发表于 2010-05-22 09:49 : 评论 ( 2 条评论 )

此功能为用户可选功能,需要的童鞋可以将以下面的代码加到locoy.config.php中。
功能是从配置的随机回复内容是随机读取3条以上内容,并发布到帖子里。

//以下是随机回复设置,多条回复用|||分开 $replymessage = "回复1|||回复2|||回复3|||回复4|||回复5|||回复6|||回复7|||回复8|||回复9|||回复10|||回复11|||回复12|||回复13|||回复14|||回复15|||回复16|||回复17|||回复18|||回复19|||回复20|||回复21|||回复22|||回复23|||回复24|||回复25|||回复26|||回复27|||回复28|||回复29|||回复30"; $replymessage = explode('|||', $replymessage);shuffle($replymessage); $replycount = rand(3, count($replymessage)); //随机回复条数 for($i=0;$i<$replycount;$i++) $_G['gp_message'] .= '|||'.$replymessage[$i];

discuz X采集程序开发日志

发表于 2010-05-5 02:26 : 评论 ( 2 条评论 )

一,功能预览

  1. 主题发布功能
  2. 回复发布功能
  3. 原贴发布用户与时间
  4. 任意类型附件上传识别
  5. 用户自动注册、自动激活,增加邮箱地址生成功能
  6. 支持游客匿名,支持单用户发贴模式
  7. 支持主题分类和分类信息模型
  8. 支持HTML、支持隐藏、支持主题积分功能
  9. 其它特性

二,界面预览

Discuz!X采集发布模块[X1][X1.5][帖子][文章][群组][日志][09-03更新]

发表于 2010-05-1 12:45 : 评论 ( 26 条评论 )

感谢您使用 尘缘(ID:vus520; QQ:130775) 开发的 Discuz! X1.5/X1 web发布模块

模块更新日志:

  1. 2010-09-03,基于X1.5RC发布X1.5模块
  2. 2010-05-25,增加日志、记录模块
  3. 2010-05-21, 增加群组发布模块
  4. 2010-05-20,修正文章发布模块,确认支持Discuz!X 1 正式版
  5. 2010-05-16,发布测试模块

适用版本及程序参数设置:

  1. Discuz! X1.5,Discuz! X1,Discuz! X1 Beta
  2. 基于默认模板开发,未启用登陆验证码,未启用发贴验证码
  3. 网站根地址填写:http://www.4wei.cn/bbs/,末尾加/

模块密码:

  1. “www.4wei.cn”,不含引号

常见问题及解决办法:

  1. 有登陆验证码或者使用经典登陆不成功,请使用内置浏览器获取Cookie!
  2. 登陆错误及提示“您还未登录”的解决办法及视频教程:http://www.4wei.cn/archives/1000446
  3. 发布内容出现数据丢失,请使用Urlencode发布

Discuz! X1.5全套模块打包下载,ALLInOne:Discuz!_X1.5_Allinone

Discuz! X1全套模块下载:

  1. 帖子发布模块下载:Discuz X BBS
  2. 文章发布模块下载:

已经开发新浪微博发布模块

发表于 2010-04-26 08:56 : 评论 ( 1 条评论 )

版本:火车采集器V2009,V2010

价格:50元一份

WordPress采集发布模块,2.8/2.9通用

发表于 2010-03-27 18:57 : 评论 ( 没有评论 )

火车采集器多页面采集功能的使用,视频教程

发表于 2010-03-26 22:43 : 评论 ( 4 条评论 )

本集视频教程通过三个网站的多页采集方法,讲解火车采集器的多页采集功能。

多页面采集适合的情景:

  • 内容页中含有通向多页的链接,或者有某些第三个需要的参数
  • 多页可以通过内容页的地址生成
  • 内容页中,只有一个多页链接

多页面采集的常见网站类型:

  • 内容页中有框架页面
  • 内容页中有Ajax请求页面
  • 内容页中有JS调用页面,如淘宝网
  • 内容页中的第三页需要的参数,如软件下载网站

火车采集器获取Cookie不准确、登陆不正常、不能下载附件的解决办法

发表于 2010-03-2 14:40 : 评论 ( 2 条评论 )

使用火车采集器内置的浏览器,能很方便的获取到需要登陆的网站Cookie值,基本上能满足大多数网站的采集需求。

然而,受系统权限和目标网站的验证限制,有一些情况,使用火车采集器内置浏览器获取的Cookie并不准确,或者虽然Cookie值是准确的,却无法正常的模拟登陆,出现一些不能登陆发布内容、不能正常发布附件的情况。造成反复登陆却总是提示没有登陆的错误提示,或者下载附件时,出现下载的附件是一些.php文件的情况。

针对这种情况,尘缘今天做了2010年的第一个视频教程。今天讲的内容,着重分析了问题产生的原因和解决办法,并仔细讲了如何解决不能下载附件的一些解决办法。

希望对大家有用。今天的视频,我依然使用最高清晰度的压制比例,视频文件可能个头比较大,目的是为了让大家看清楚画面上的文字,避免产生误导。