搜索资源列表
SQLET_spider
- 网络机器人又称为Spider程序,是一种专业的Bot程序。用于查找大量的Web页面。它从一个简单的Web页面上开始执行,然后通过其超链接在访问其他页面,如此反复理论上可以扫描互联网上的所有页面。-network robot also known as Spider procedures, is a professional bot procedures. Looking for a large number of Web pages. From a simple Web pages to beg
SearcherEngine
- Java做的搜索引擎,用bot和lucene搭建 非常不错的程序
sogzq
- 功用:跟踪搜索引擎的蜘蛛(BOT),并进行记录,提供在线察看和生成cvs格式文档下载。-function : tracking search engine spiders (BOT), and make a record, View online and generate cvs format files downloaded.
bot
- java 网络爬虫,可用于网站采集,搜索,
bot-package-1.4
- 网络搜索引擎方面的源码,是个著名书籍上的例子,很有权威性-bot-pack
bot
- 网络爬虫源代码,供学习。 -web spider
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开