搜索资源列表
oxyus-0.2.3
- 搜索引擎,是一个java开源的,很不错的,不过我没条件测试啊.-search engine, is an open-source java, very good, but I did not test conditions ah.
wherespider_1.0.4.0_source
- java 的一个开源搜索引擎 java 的一个开源搜索引擎
lucene-2.0.0-src
- 著名开源搜索的2。0版本,全文检索引擎,JAVA版本
webharvest1-project
- Web-Harvest是一个Java开源Web数据抽取工具。它能够收集指定的Web页面并从这些页面中提取有用的数据。Web-Harvest主要是运用了像XSLT,XQuery,正则表达式等这些技术来实现对text/xml的操作
IKAnalyzer2.0.2
- Java lucene开源全文搜索,中文分词组件
je-analysis-1.5.3
- java lucene 开源全文检索,中文分词组件之 je-analysis-1.5.3
Webloup
- WebLoupe is a java-based tool for analysis, interactive visualization (sitemap), and exploration of the information architecture and specific properties of local or publicly accessible websites. Based on web spider (or web crawler) technology. 开源搜索爬
lucene-3.0.0
- lucene-3.0.0.zip 纯java语言的开源搜索引擎 集索引与搜索一体 支持二次开发 最新版本-lucene-3.0.0.zip pure java open source search engine, assembly language, indexing and search together to support the latest version of the secondary development of
heritrix-1.14.4
- heritrix-1.14.4 纯JAVA开发的,开源的Web网络爬虫-heritrix-1.14.4 pure JAVA development, open source Web crawler
nutchbook
- Nutch 是一个开源的、Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。本电子数据里有详细的介绍-Nutch is an open-source, Java to achieve search engine. We run it offers its own search engine all the necessary tools.
zhizhu
- 一款蜘蛛程序,国外开源.适合二次开发.一个JAVA开发的简单网络爬虫 可以实现对指定站点新闻内容的获取 程序很简单 大家一起学习.-<!-- You may freely edit this file. See commented blocks below for --> - <!-- some examples of how to customize the build. --> - <!-- (If you delete it
lucene-3.0.0-src
- lucene-3.0.0-src.zip 纯java开源搜索引擎的源代码 初学者好好揣摩 apache家族的一个子项目 提供一个索引和搜索的框架,支持二次开发 Lucene的最新版本-lucene-3.0.0-src.zip pure java open source search engines try to figure out the source code for beginners a good family, an apache sub-project to provide a fr
lucene2
- 使用java开发的开源搜索引擎软件,内含完整源代码,适合学习搜索引擎的人不可多得的好材料。-Java development using open source search engine software that includes full source code search engine for people to learn the rare good material.
openwysiwyg_v1.4.7
- openWYSIWYG是一个跨浏览器,纯Javascr ipt开发,强大开源的WYSIWYG编辑器。支持多种Web编程语言:PHP,ASP,ASP.net,Perl,Java,Cold Fusion-openWYSIWYG is a cross-browser, pure Javascr ipt development, a powerful open-source WYSIWYG editor. Support a variety of Web programming languages: P
4pm
- 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
paoding-analysis-2.0.4
- Paoding中文分词是一个使用Java开发的,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。 Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为互联网网站首选的中文分词开源组件。 Paoding中文分词追求分词的高效率和用户良好体验。-Paoding Chinese word is a Java development can be combined with Lucene applications for the word componen
ansj
- ictclass的java版本开源实现,用于实现中文分词功能。-the java version that the open source implementation of ictclass
SearchEngine
- dySE 是个开源的 Java 小型搜索引擎。该搜索引擎分为三个模块:爬虫模块、预处理模块和搜索模块。其中详细阐述了: 多线程页面爬取、正文内容提取、文本提取、分词、索引建立、快照等功能的实现。-dySE is an open source Java small search engines. The search engine is divided into three modules: crawler module, pretreatment module and search module