CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 Internet/网络编程 搜索引擎 搜索资源 - text based retrieval

搜索资源列表

  1. 4pm

    0下载:
  2. 本文用lucene和Heritrix构建了一个Web 搜索应用程序 Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。 Lucene很强大,但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spider。网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。 Heritrix是一个纯由Java开
  3. 所属分类:Search Engine

    • 发布日期:2017-05-11
    • 文件大小:2989088
    • 提供者:曹志聪
  1. BBSspider

    0下载:
  2. 指定论坛文本数据采集系统,可以对指定的论坛进行数据采集,并且可以根据采集结果进行分类检索-Specified the forum text data acquisition system can be specified forum for data collection and classification retrieval based on the collected results
  3. 所属分类:Search Engine

    • 发布日期:2017-11-13
    • 文件大小:745832
    • 提供者:linyang
搜珍网 www.dssz.com