火车采集器第二期教程目录

火车采集器第二期教程

·   前言

1.     什么是采集器,采集器的工作原理,运用范围

2.     网站管理系统与采集器(CMS+LocoySpider)的运用和前景

3.     本教程的相关术语和学习要求

·   第一部分,软件与功能介绍

1.     火车采集器软件介绍,功能简介,购买及售后简介

2.     火车采集器软件的下载,环境安装

3.     火车采集器软件界面,功能菜单介绍,版本介绍

4.     重难点:火车采集器工作流程

·   第二部分,站点功能及操作

1.     站点的建立、删除,站点规则导入、导出

2.     站点规则制作请参考任务规则制作

·   第三部分,任务功能与操作,重难点内容

1.      第一步,任务的建立、删除、数据处理,任务规则导入、导出、复制

2.      第二步,添加采集网址规则:自动分析链接

2.1.   重难点:添加采集网址规则:手动设置链接格式

3.      第三步,规则标签的建立、修改、删除、复制

3.1.   第四步:使用前后截取模式采集数据

3.2.   重难点:使用正则匹配模式采集数据

3.3.   重难点:使用自定义格式获取数据

3.4.   重难点:过滤、替换、文件下载设置

3.5.   进阶篇:使用正则表达式的采集方法

4.      第四步:配置发布方式

4.1.   重难点:WEB发布方式介绍与配置

4.2.   重难点:数据库发布方式介绍与配置

5.      第五步:文件保存及任务运行时设置

·   第四部分,火车采集器内容发布模块的制作与配置

1.     免费版:WEB发布模块介绍、建立、制作、修改、加密

2.     标准版:数据库发布模块介绍、建立、制作、修改、加密

3.     重难点:DEDECMS简介,DEDECMSWeb发布模块的制作

·   第五部分,数据采集、编辑、发布,自动更新,数据库整理等

1.     采集任务的启动,停止,批量设定

2.     标准版:任务自动更新设置,采集数据库处理

·   第六部分,完整规则的制作、采集、发布

1.      论坛发布:采集Discuz 6.1论坛帖子与回复

1.1.   论坛发布:发布Discuz 6.1论坛帖子与回复(使用接口文件)

2.      CMS实例:采集并实现 DEDE V5.1 图片模型内容的发布,下载附件,远程附件

3.      博客实例:实现百度空间内容的发布

4.      进阶:多特软件站全站采集与自动更新

·   第七部分,其它

1.     火车采集器多功能插件的配置与使用

2.     产品与服务订制,联系方式与报价

 

发表评论