搜索资源列表
seo_1.3_600it
- Z:\\BoFut_搜索引挚源码分析\\01-SEO\\Google 搜索 引擎 算法 的 秘密.rar
jspider-src-0.5.0-dev
- 一个JAVA的网络爬虫源码,可以爬取包括PDF,DOC,HTML等内容,相当不错!-A JAVA source network reptiles can climb check, including PDF, DOC, HTML and other content, very good!
Z-emailCollector
- 1、它类似于一个蜘蛛程序,可以分析抓取到的每个网页,找出网页上面的email地址并将其提取出来; 2]kIqn*] 2、它又类似于一个人,可以选择点击什么样的链接,不点击什么样的链接,而不是每个链接都点击; V>bfNQK 3、它也可以选择自己感兴趣的邮箱地址进行提取并保存,而不是每个邮箱地址都抓取; 5n{Ap|E3 4、它可以根据您的指示忠实的完成第2步和第3步的功能。 oh1n+ Z 5、它可以根据您的指示将抓取到的邮箱地址列表保存在任何位置
sphinx-0.9.8-rc2-chinese
- 搜索引擎,和MYSQL结和搜索网站的内容,速度极快,可以达到0.00XX秒.-Search engine, and MYSQL node and search site, extremely fast, can be achieved 0.00XX seconds.
heritrix1.14.4
- heritrix1.14.4.zip版,欢迎下载-heritrix1.14.4.zip version, welcome to download