CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 Internet/网络编程 搜索引擎 搜索资源 - components

搜索资源列表

  1. yider_0_5_3

    0下载:
  2. the Yider is an open source VBscr ipt spider that allows you to quickly add a search system to your site like the one at the top of this page. It stores data in a Microsoft Access or SQL 2000 database with full text searching. The Yider does not requ
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:61538
    • 提供者:zz
  1. lucene-1.2

    0下载:
  2. 索引和检索接口,为搜索引擎的开发提供了核心组件为搜索引擎的开发提供了核心组件-indexing and retrieval interface, Search engine for the development of the core components of the search engine provided for the development of the core components
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:916554
    • 提供者:foot
  1. heritrix.rar

    0下载:
  2. web 网络爬虫 用户可以使用它从网络上抓取想要得资源,开发者还可以扩展它的各个组件,来实现自己的抓取逻辑。,Reptile web network users can use it from the network you want to crawl resources, developers can also extend its various components, to achieve their own logic crawl.
  3. 所属分类:Search Engine

    • 发布日期:2017-06-11
    • 文件大小:19386712
    • 提供者:echoli
  1. heritrix2.rar

    1下载:
  2. Heritrix是一个爬虫框架,可加如入一些可互换的组件。 它的执行是递归进行的,主要有以下几步: 1。在预定的URI中选择一个。 2。获取URI 3。分析,归档结果 4。选择已经发现的感兴趣的URI。加入预定队列。 5。标记已经处理过的URI ,Heritrix is a framework for reptiles, such as income may be a number of interchangeable components. It is a recursive implem
  3. 所属分类:Search Engine

    • 发布日期:2017-06-12
    • 文件大小:19729188
    • 提供者:王某
  1. lucene-2.0.0

    0下载:
  2. 搜索组件lucene2.0,非常好的一个java全文检索工具-Search components lucene2.0, very good full-text search tool for java
  3. 所属分类:Search Engine

    • 发布日期:2017-05-13
    • 文件大小:3413774
    • 提供者:maolin
  1. DictSeg

    0下载:
  2. Lucene的一个不错的分词组件,效果还不错,现在已经是1.4版本了-Lucene' s a good word components, the results were good, and is now 1.4 version of the
  3. 所属分类:Search Engine

    • 发布日期:2017-03-28
    • 文件大小:119710
    • 提供者:顾林
  1. Luz.Net

    0下载:
  2. 搜索引擎组件,可以开发大型搜索引擎系统,很好,希望开发搜索引擎的朋友下载-Search engine components, can develop large-scale search engine system, well, hoping to develop search engine friend to download
  3. 所属分类:Search Engine

    • 发布日期:2017-04-02
    • 文件大小:104656
    • 提供者:oo
  1. nutch-analysis

    0下载:
  2. 开源搜索引擎nutch的爬虫部分分析。包括Nutch数据集的基本组成和流程。-Open source search engine nutch reptiles part analysis. Nutch data set includes the basic components and processes.
  3. 所属分类:Search Engine

    • 发布日期:2017-03-30
    • 文件大小:483214
    • 提供者:EndlessRoad
  1. 4pm

    0下载:
  2. 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
  3. 所属分类:Search Engine

    • 发布日期:2017-05-11
    • 文件大小:2989088
    • 提供者:曹志聪
  1. paoding-analysis-2.0.4

    0下载:
  2. Paoding中文分词是一个使用Java开发的,可结合到Lucene应用中的,为互联网、企业内部网使用的中文搜索引擎分词组件。 Paoding填补了国内中文分词方面开源组件的空白,致力于此并希翼成为互联网网站首选的中文分词开源组件。 Paoding中文分词追求分词的高效率和用户良好体验。-Paoding Chinese word is a Java development can be combined with Lucene applications for the word componen
  3. 所属分类:Search Engine

    • 发布日期:2017-05-27
    • 文件大小:9799997
    • 提供者:ltqjun
  1. TikaTest

    0下载:
  2. 关于Tika组件的使用示例,自己平时测试时用的可以支持各种文件到String的转换-About Tika components using the sample, usually used when testing can suppo
  3. 所属分类:Search Engine

    • 发布日期:2017-04-04
    • 文件大小:3817
    • 提供者:陈大侠
  1. HelloLucene

    0下载:
  2. 自己写的Hello Lucene 包括了一些基本的Lucene调用过程 索引的建立和写入读取-About Tika components using the sample, usually used when testing can support various file to write their own String conversion Hello Lucene includes some basic Lucene calls the establishment of process
  3. 所属分类:Search Engine

    • 发布日期:2017-05-23
    • 文件大小:7876421
    • 提供者:陈大侠
  1. ExtractUtil

    0下载:
  2. 做搜索时经常用到的extract解析组件工具,将异构文档解析为string从而方便写入索引 -Do search often used analytical components, the extract of the heterogeneous document parsing string by the write index
  3. 所属分类:Search Engine

    • 发布日期:2017-04-10
    • 文件大小:1228
    • 提供者:陈大侠
  1. WPCrawler

    0下载:
  2. 网络爬虫,也叫网络蜘蛛,有的项目也把它称作“walker”。维基百科所给的定义是“一种系统地扫描互联网,以获取索引为目的的网络程序”。网络上有很多关于网络爬虫的开源项目,其中比较有名的是Heritrix和Apache Nutch。 有时需要在网上搜集信息,如果需要搜集的是获取方法单一而人工搜集费时费力的信息,比如统计一个网站每个月发了多少篇文章、用了哪些标签,为自然语言处理项目搜集语料,或者为模式识别项目搜集图片等等,就需要爬虫程序来完成这样的任务。而且搜索引擎必不可少的组件之一也
  3. 所属分类:Search Engine

    • 发布日期:2017-05-09
    • 文件大小:1863846
    • 提供者:Francis
搜珍网 www.dssz.com