搜索资源列表
parker.rar
- 一个FTP搜索引擎,CGI界面、后台自动更新数据。运行在linux等标准Unix。
dpsearch-4.36.tar
- DataparkSearch是一个C/C++的web搜索引擎,它包括两个部分,一个indexer来收集和存储数据,一个web CGI 前端提供搜索所收集的数据。-DataparkSearch is a C / C web search engine, which includes two parts, an indexer to collect and store data, a web CGI front-end search the data collected.
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化。(多线程检索,同步DNS查询, 按站点将结果分组, Web
EasyXSpider
- EasyXSpider不仅仅是一个简单的Linux下的爬虫程序。更包括了,索引制作,检索,分词(英文及中文二元法切词),以及Google PageRank算法和CGI查询界面的实现。可以看做是一个完整的小型搜索引擎。
parker.rar
- 一个FTP搜索引擎,CGI界面、后台自动更新数据。运行在linux等标准Unix。,A FTP search engine, CGI interface, the background to automatically update data. Running on linux standard Unix.
EasyXSpider
- 一个Linux下的爬虫,倒排序索引,多条件检索,二元切词以及Google PageRank算法的示例程序。包括CGI的查询界面。Cool!~-Linux under a reptile, invert index, multi-condition searches, Chinese binary segmentation, as well as an example of Google PageRank algorithm procedures. Including the CGI query
search
- search engine from selected txt files in .cgi document sort by 0.5 mutual score for every similarity.