搜索资源列表
weblucene
- Lucene Web interface, use XML as a lightweight protocol. developer can convert data source (text, DB, MS Word, PDF... etc) into xml format, indexing with lucene engine, and get full text search result via HTTP, with XML format output, user can easily
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化。(多线程检索,同步DNS查询, 按站点将结果分组, Web
xunlong0.6
- 完整的.net搜索引擎采用LUCENE.net为索引核心,分布式架构.包含wordnet,分词,spider,简单webserver等-complete. Net using search engines for indexing LUCENE.net core, Distributed framework. includes WordNet, participle, spider, a simple webserver, etc.
12spider
- 网络蜘蛛源码。 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页 ,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎 派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网 站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级 越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同 一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引 擎收录的收录情况等等有相当重要的作用。-Spider-source ne
TwitterData-csharp
- 爬社交网络数据程序, 用C#编写,比较基本,适用于初学者学习交流。-It is used to crawl data from online social networks. Realized basic functions such as making API connection, request data, etc.
GAMECAIDAN
- [原创]新版网吧游戏菜单 V2.0 超强版 由于朋友需要所以帮忙写了个游戏菜单,程序接近完美,所以请大家来PP 带有在线管理功能,可在线修改游戏设置。 带有本地歌曲点播功能,程序可播放本地或网络歌曲 带有百度音乐搜索功能,搜索出来的歌曲可在线播放,下载等-[Original] The new Internet version of the game menu V2.0 Superacid So as a result of the need to help a friend wr
12345
- 这是一个QQ空间免费歌曲链接,提供各种歌曲的免费下载,可以从各个方面进搜索,例如歌手名,歌曲名等 -This is a song link QQ space free of charge, providing a variety of songs downloaded free of charge, you can enter from all aspects of search, such as the singer name, song name, etc.
LuceneinAction
- 学习lucene的很好的一本书,书中详细的介绍了lucene由来以及lucene的核心等.-Lucene study of a very good book introduces in detail the origin of lucene, etc., as well as the core of lucene.
SearchEng
- Image Search Ingine, To search a image from database and process all operation like delete,update select etc
1.RAR
- 搜索引擎一词在国内外因特网领域被广泛使用,然而他的含义却不尽相同。在美国搜索引擎通常指的是基于因特网的搜索引擎,他们通过网络机器人程序收集上千万到几亿个网页,并且每一个词都被搜索引擎索引,也就是我们说的全文检索。著名的因特网搜索引擎包括First Search、Google、HotBot等-Internet search engine is used in the field is widely used abroad, but his meaning is different. Of the
ProgrammingPCollectivePIntelligence
- 本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过
proxyfire.v1.22
- 从搜索引擎中提取代理,可以对代理进行验证,分析等功能。-to get proxy from google etc,and also can analysis proxy.
shishishousuo
- 这是一个基于有道搜索引擎的实时搜索软件,可以在第一时间搜索到网络上发布的一些新信息,比如发布的微博,发布的信息等等。-This is a proper way on the real-time search engine search software, you can search the network for the first time released some new information on, such as the release to it, and release of
yioop-v0.76
- Yioop! 是一个 PHP 的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, 以及 sitemaps。 Yioop! Version 0.76 发布,该版本增加了获得Yioop! 之外的搜索结果的函数API,提高了RSS响应,允许包含图片。加强了在线文档,简化了arc_tool同步,修复了导致大型索引崩溃的目录输出缓冲的一个
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
Web-search-tools
- 网址检索工具,用于网络搜索、检索、查询等。-Web search tools, used in web search, retrieval, query etc..
The-ultimate-search-artifact
- 搜索各种网盘,视频网站,贴吧,论坛,内容多样,包括资料,视频,种子等。-Search all kinds of network backup, video sites, post bar, BBS, content variety, including data, video, seeds, etc.