火车采集器多语种翻译插件[支持Google/有道翻译API]

很多火车采集器用户,都能在短时间内采集大量数据,但无法解决内容收录问题。虽然内容数量过万千级,但收录可能只有百千级。

有的用户建议火车采集器增加一些伪原创功能,考虑到火车采集器只是一款功能强大的数据采集软件,站群和优化概念不强,估计伪原创功能不会提升太多。

好在火车采集器是唯一一款支持多语言插件的采集器,支持PHP、C内置插件,我们可以根据需要开发自己想要的优化功能。

火车采集器多语种翻译插件,是一款支持Google翻译、有道翻译的插件,目前内置了Google和Youdou翻译API,支持多国语言翻译,包括汉英、英汉等大多数常见语种。目前没有加入Bing翻译是因为Bing的长句翻译速度太慢。

压缩包中的文件直接解压到LocoySpider\Plugins目录下,然后在任务-高级设置-插件设置,保存时使用Translate.php即可。

本插件免费发布,适用于标准版及以上版本!


<?php
/*
**火车采集器通用翻译接口,适用于标准版及以上版本
**作者:尘缘
**博客:http://www.4wei.cn
*/
/* 有内容标签时,将内容标签翻译成英文 */
if(isset($LabelArray['内容']) && $LabelArray['内容'])
{
 require('Translate/GoogleTranslate.class.php');
 $Google = new GoogleTranslate();
 $Google->translate($LabelArray['内容'], 'zh-CN', 'en');

 $LabelArray['内容'] = $Google->result;

 /*Google翻译为空时,使用有道翻译*/
 if(!$LabelArray['内容'])
 {
  require('Translate/YouDaoTranslate.class.php');
  $Youdao = new YouDaoTranslate();
  $Youdao->translate($LabelArray['内容'], 'ZH_CN2EN');
  $LabelArray['内容'] = $Youdao->result;
 }
}

echo serialize($LabelArray);
?>

下载地址:http://www.4wei.cn/archives/1000487

发表评论

电子邮件地址不会被公开。