搜索资源列表
lucene.net-1.4.3.final-004-21Nov05.src
- Lucene是一个开放源程序的搜寻器引擎,利用它可以轻易地为Java软件加入全文搜寻功能-Lucene is an open source search engine. it can be easy to join the Java software by the search function
lucene-2.0.0-src
- java全文搜索引擎 Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。 Lucene的作者:Lucene的贡献者Doug Cutting是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Copland操作系统的成就之一)的主要开发者,后在Excite担任高级系统架构设计师,目前从事于一些INTERNET底层架构的研究。他贡献出的Lucene的目标是为各种中小型应用程
lucene_cn
- lucene中文搜索包,用于构建搜索 Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。 Lucene的作者:Lucene的贡献者Doug Cutting是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Copland操作系统的成就之一)的主要开发者,后在Excite担任高级系统架构设计师,目前从事于一些INTERNET底层架构的研究。他贡献出的Lucene的目标是为
luke-src-0.7
- Lucene is an Open Source, mature and high-performance Java search engine. It is highly flexible, and scalable from hundreds to millions of documents. Luke is a handy development and diagnostic tool, which accesses already existing Lucene indexes
使用Java搜索Internet
- Search Crawler 是用于Web搜索的一个基本的搜索程序,它展示了基于搜索程序的应用程序的基础框架。-Search Crawler Web search for a basic search procedures, it features based on the search application's basic framework.
heritrix.rar
- web 网络爬虫 用户可以使用它从网络上抓取想要得资源,开发者还可以扩展它的各个组件,来实现自己的抓取逻辑。,Reptile web network users can use it from the network you want to crawl resources, developers can also extend its various components, to achieve their own logic crawl.
asearch
- Java写的搜索引擎,是一个applet-A searching engine written by java, and it is an applet
clucene-core-0.9.21b
- CLucene是C++版的全文检索引擎,完全移植于Lucene,采用 STL 编写。-CLucene is a C++ port of Lucene: the high-performance, full-featured text search engine written in Java. CLucene is faster than lucene as it is written in C++.
nutchbook
- Nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。本电子数据里有详细的介绍-Nutch is an open-source, Java to achieve search engine. We run it offers its own search engine all the necessary tools.
zhizhu
- 一款蜘蛛程序,国外开源.适合二次开发.一个JAVA开发的简单网络爬虫 可以实现对指定站点新闻内容的获取 程序很简单 大家一起学习.-<!-- You may freely edit this file. See commented blocks below for --> - <!-- some examples of how to customize the build. --> - <!-- (If you delete it
craw
- It is used to search the website. It acts as a search engine.
spidering.tar
- spidering the web, work like crawler, and has visualization links. It is java
SearchEngineScheme
- 一个小型的搜索引擎,很适合学习,了解一定的搜索引擎的基本常识。-A small search engine, it is suitable for learning, understanding some basic knowledge of search engines.
SearchEngine
- 这是一套拿去就能用的Java毕业论文资料,内含JAVA技术实现搜索引擎的源代码、技术文档、编译JAR文件,如果你想偷懒的话,拿去就能用了。尤其是作者的文档写的很有水平,足以看出下了一番功夫,源代码也比较完整,不过环境配置比较麻烦。-This is a set of Java with the thesis will be able to take information technology to achieve search engine contains the JAVA source co
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
GetWeb
- 以下是一个Java爬虫程序,它能从指定主页开始,按照指定的深度抓取该站点域名下的网页并维护简单索引。-The following is a Java reptiles, it can start from the specified Home to crawl pages under the domain name of the site in accordance with the specified depth and maintain a simple index.
demo
- 实现java网页爬虫功能,内容详细,包含了多个预留功能接口(accomplish the spider function and it's very copmpletely)