火车采集器多语种翻译插件[支持Google/有道翻译API]
很多火车采集器用户,都能在短时间内采集大量数据,但无法解决内容收录问题。虽然内容数量过万千级,但收录可能只有百千级。
有的用户建议火车采集器增加一些伪原创功能,考虑到火车采集器只是一款功能强大的数据采集软件,站群和优化概念不强,估计伪原创功能不会提升太多。
好在火车采集器是唯一一款支持多语言插件的采集器,支持PHP、C内置插件,我们可以根据需要开发自己想要的优化功能。
火车采集器多语种翻译插件,是一款支持Google翻译、有道翻译的插件,目前内置了Google和Youdou翻译API,支持多国语言翻译,包括汉英、英汉等大多数常见语种。目前没有加入Bing翻译是因为Bing的长句翻译速度太慢。
压缩包中的文件直接解压到LocoySpider\Plugins目录下,然后在任务-高级设置-插件设置,保存时使用Translate.php即可。
本插件免费发布,适用于标准版及以上版本!
[php]
<?php
/*
**火车采集器通用翻译接口,适用于标准版及以上版本
**作者:尘缘
**博客:http://www.4wei.cn
*/
/* 有内容标签时,将内容标签翻译成英文 */
if(isset($LabelArray[‘内容’]) && $LabelArray[‘内容’])
{
require(‘Translate/GoogleTranslate.class.php’);
$Google = new GoogleTranslate();
$Google->translate($LabelArray[‘内容’], ‘zh-CN’, ‘en’);
$LabelArray[‘内容’] = $Google->result;
/*Google翻译为空时,使用有道翻译*/
if(!$LabelArray[‘内容’])
{
require(‘Translate/YouDaoTranslate.class.php’);
$Youdao = new YouDaoTranslate();
$Youdao->translate($LabelArray[‘内容’], ‘ZH_CN2EN’);
$LabelArray[‘内容’] = $Youdao->result;
}
}
echo serialize($LabelArray);
?>
[/php]