搜狗(Sogou)图片的采集测试

by 尘缘 on 七月 2nd, 2008 // Filed Under → Works

var jsimg1=["http://images1.danawa.com.cn/image_blogs/20070513/11790505076.gif","http://space.danawa.com.cn/article/26330.html"

,"香车美女","812","600","137k","http://tn4.pic.sogou.com/b1c1864732c68dc3.jpg","b1c1864732c68dc3 d2f417c732c68dc3

491a39d732c68dc3 869471c732c68dc3 10cb301732c68dc3 7f76403732c68dc3 8394933732c68dc3 fcba1a8732c68dc3"];

热狗的图片引擎真是把图片搜索技术练到家了,让我很想采集他的套图功能.
受技术和算法限制,今天记下相关数据,便于日后研究.若有这方面研究的朋友,欢迎大家一起讨论.

你可以任意转摘“搜狗(Sogou)图片的采集测试”,但请保留本文出处和版权信息。
作者:尘缘,QQ:130775,来源:http://www.4wei.cn/archives/85

有 3 条评论啦

Posted on 2008年07月3号 at 18:36:39

杨树海 :

他到底是怎么加密的呢.恐怖呀.

Posted on 2008年10月22号 at 01:20:44

杨 树海 :

今日终于知道,他这些乱码,其实是ID.

每个ID对应不同的图片地址。

呵呵,问题迎刃而解。

Posted on 2009年08月10号 at 22:28:29

will :

兄弟现在我也要采这东西,不过这ID没什么意思呀,对应的是搜狗本地的小图片!原图的地址要去哪里找呀?页面是从哪里引入图片的呀!

简单来说,把图片地址都加密了,类似于MD5加密成一个长度的图片ID,组图时只显示第一张图片的图片地址,其它的图片,使用Ajax查询并输出。目前已经开发出一个采集程序,有需要的话可以联系。



走过路过,千万不要飞过,那是鸟人: