搜索资源列表
spider(java)
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-web crawling robots - known network (Robot), Web crawling,
msnman
- MSN机器人程序,实现通过MSN作为机器人自动应答和业务处理的一个例程-MSN robot program to achieve through MSN as the robot automatically and operational response to deal with a routine
Search_Engine
- 描述了搜索引擎的系统结构,从网络机器人、索引引擎、Web服务器三个方面进行详细的说明,并通过实现一个新闻搜索引擎来进行例证。-Describes the search engine' s system structure, from the network robot, indexing engine, Web server three areas detailed explanation, and through the realization of a news search engi
NetBotJava
- 很难得的一本java spider 开发的资料书,写得很全面,有比较全的例子,开发出来的东西可以直接修改一下使用,,<网络机器人Java编程指南>-Hard to come by a java spider information on the development of the book, write a very comprehensive, more full of examples of things that can be developed to directly mo
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
QGroupRobot
- 一个使用java swing开发的QQ群机器人,使用了最新的webQQ协议,可以实现自动回复QQ好友QQ群,可以修改源代码实现更多功能-One developed using java swing robot QQ group, using the latest webQQ agreement can automatically reply QQ friends QQ group, you can modify the source code to achieve more functional
smartqq-master
- Java 实现的QQ聊天机器人,通过SmartQQ协议登陆。-Java implementation of the QQ chat robot