搜索资源列表
Nalanda-iVia-Crawler-1.0.1.tar
- 主题爬行源码.很经典的.对研究主题爬行的人很有帮助.-theme crawling source. Very classic. The themes were very helpful crawling.
lucene-1.9.1
- lucene-1.9.1版本,很好用的开源全文搜索引擎工具包-Lucene - 1.9.1 version of the open-source very good full-text search engine tool kit
mysoo-1.0-preview
- Mysoo 网络时代,人人都可以拥有的站内搜索引擎! 小强拥有一个自己的娱乐门户网站,而且有不错的访问量,Alexa排名也蒸蒸日上,几年前小强就已经采用了专业的CMS和BBS系统,最近更是采用了Blog、eShop,甚至是时下如火如荼的Web2.0等技术来武装他的站点
firtex-1.0.3_RC_src
- 中文开源搜索引擎firtex-1.0.3_RC版 架构、接口做了重大改进 修正了一些BUG 增加了对gz压缩的TREC格式的支持 增加了对北大天网数据集的支持 增加了同时检索内存中索引数据的支持 支持实时在线索引和检索 实现了在线索引更新的几个策略 ...
apache-tika-0.1-incubating-src.tar
- apache基金项目tika,是一个可以对内容进行分析、提取的开发包,结合正则开发包,可以开发基于垂直搜索引擎,目前正处于孵化阶段,这里是目前的最新版本
hyperestraier-1.4.13
- 1.Hyper Estraier是一个用C语言开发的全文检索引擎,他是由一位日本人开发的.工程注册在sourceforge.net(http://hyperestraier.sourceforge.net). 2.Hyper的特性: 高速度,高稳定性,高可扩展性…(这可都是有原因的,不是瞎吹) P2P架构(可译为端到端的,不是咱们下大片用的p2p) 自带Web Crawler 文档权重排序 良好的多字节支持(想一想,它是由日本人开发的….) 简单实用的A
je-analysis-1.5.3
- java lucene 开源全文检索,中文分词组件之 je-analysis-1.5.3
kua_souV0.1
- 夸搜高仿百度搜索引擎源码(带蜘蛛和竞价排名系统)V0.1.rar-Quarry search engine Baidu search high imitation source (with the spider and the bidding system) V0.1.rar
ITool
- ITool网站综合查询系统是我练习PHP写的小东西之一,提供页面信息、PR、Alexa、搜索收录、域名Whois查询功能,只要输入域名即可查询。 程序使用说明: 1.ITool网站综合查询系统属于开源程序,未做任何加密; 2.ITool网站综合查询系统采用UTF-8国际编码,修改文件请使用DW/EDITPLUS等软件,勿用系统自带记事本; 3.ITool网站综合查询系统的系统设置在Lib/Include.php里,修改相应的值即可; 更新记录 V1.0.1(2
mahout-0.3
- mahout是一个开源的软件包,对搜索引擎的聚类,分类算法以及推荐系统算法的代码实现-mahout is an open source software package, the search engine clustering, classification and recommendation system algorithm algorithms code
heritrix-1.14.4
- heritrix-1.14.4 纯JAVA开发的,开源的Web网络爬虫-heritrix-1.14.4 pure JAVA development, open source Web crawler
larbin_1.1.2.tar
- 互联网蜘蛛索引系统,类似于www.av.com的robot索引工具 可迅速对互联网中的web页面进行索引,生成搜索引擎的数据库 采用了相当快速的索引算法,在一台普通pc上可即时索引超过100 000 000的页面数量 -Internet spiders index system. www.av.com robot similar to the rapid indexing tool for Internet web pages cable guidelines generation
heritrix-1.14.2-src
- heritrix-1.14.2-src是网络爬虫Heritrix最新版本的源码,希望对大家有帮助-heritrix-1.14.2-src is a network of reptiles Heritrix the latest version of source, in the hope that we have to help
lucene-1.2-src.tar
- 学搜索引擎必须看的经典 入门的经典资料 代码特少-Science search engine must see classic classic data entry code small
hispider-0.1.4.tar
- hispider.tar.gz Http请求与发送示例-hispider.tar.gz Http request and send sample
lucene-2.4.1-src
- lucence搜索技术的源文件。。可用于应用程序-lucence source document search technology. . Can be used in applications
apache-solr-1.3.0
- 一个很好的搜索引擎框架!大家可以试一下!-A good search engine framework! We can try!
firtex-1.2.0_RC_src
- FirteX是一个功能强大、高性能、灵活的全文索引和检索平台。FirteX的主要目标是研究文本索引的快速构建(Index Construction),动态文档集的索引维护(Index Maintenance),短语查询(Phrase Query),Top-k查询的快速处理(Top-k Query Process)以及各种检索模型(IR Model)等。高性能和灵活的架构也使FirteX可以应用在产品搜索,桌面搜索,站内搜索,新闻搜索,Blog搜索,学术搜索以及大规模搜索引擎等领域中。-Firte
lucene3.1.0
- lucene3.1.0 全文检索 网站搜索引擎开发-lucene3.1.0 search
httpclient4.0.1-tutorial
- httpclient4.0.1是一个客户端HTTP传输类库。HttpClient作用是传输和接收HTTP消息。-httpclient4.0.1 is a client-side HTTP transport library. HttpClient role is to transmit and receive HTTP messages.
