搜索资源列表
Spideroo
- C#写的一个搜索引擎,可以搜索、建立索引等。building a simple search engine that crawls the file system from a specified folder, and indexing all HTML (or other types) of documents. A basic design and object model was developed as well as a query/results page-C# to write
一种实现中文HTML文档自动聚类的方法
- 让你的检索更精确——一种实现中文HTML文档自动聚类的方法-let you search more accurate -- A Chinese automatic HTML document clustering methods
SkypeClient
- 1、支持无限级分类,无限添加网站; 2、动态生成HTML网页文件; 3、动态生成静态搜索目录,大大减轻了服务器负担; 4、对每一个登录网站进行审核管理; 5、搜索关键词具有空格分别功能,例如:“电脑 游戏”搜索引擎会找出 关于“电脑”和“游戏”的网站; 6、方便使用的网页模板,随时做出您的个性化网页; 7、动态设置网站在搜索结果、分类目录里的排名排序; 8、可以设置登录的网站出现在多个不同分类目录上,而不需要多次登录-a support unlimited c
PHPWindblog
- PHPWind大型多用户高速博客个人主页系统 PHPWind 推出大型多用户博客(BLOG), 该系统以众多个人日志(主页)为内容基础, 为网站内容管理与发布提供了更好的解决方案! (1) 以 .html 为链接模式架设整个网站, 让站点的内容大量出现在各大搜索引擎 (2) 全面支持 二级域名 比如 我的个人主页 http://yuling.phpwind.net (3) 做为一个可独立运行的系统, 同时可选择性的与论坛会员及文章数据进行完美整合! (4) 完全支持 RSS,
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化。(多线程检索,同步DNS查询, 按站点将结果分组, Web
websearch14566
- HTML页面分析利器,可定制所需求的信息,通过直搜客理有的放矢获得海量的网络信息。-HTML pages analysis weapon, which can be customized to the needs of information, Direct Search through targeted customer Jimmy was a flood of Internet information.
turbo_cwcshop
- 系统搭建在Utility-Layer Framework之上 整个系统基于UTF8编码,全面国际化支持,适合任何语言 商城适合销售任何商品 顾客购物流程非常流畅,不产生阻塞感,有良好的购物体验 (Utility-Layer Framework特性之一) 支持注册和非注册用户购物 优良的缓存特性和特别的异步更新数据设计提供了大负载的支持 (Utility-Layer Framework特性之一) 对GOOGLE有最好的亲和度 - 通过独特的URL重写技术,对所有商品页面和
firtex_beta102_src
- FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(100G网页,11G纯文本的索引)上检索,仅使用十几M内存在数毫
htmlparser
- HTML的解析器,是Majestic-12分布式搜索引擎的一部分。作者Alex Chudnovsky, Majestic-12 Ltd (UK)。这个是3.0版本,性能经过多次优化,文档也比较全。也可以到http://www.majestic12.co.uk下载。-HTML parser, Majestic-12 distributed search engine part. Author Alex Chudnovsky, Majestic-12 Ltd (UK). This is versio
searchhtml
- java做得html页面内容搜索的程序-done html page content search procedures
12spider
- 网络蜘蛛源码。 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页 ,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎 派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网 站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级 越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同 一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引 擎收录的收录情况等等有相当重要的作用。-Spider-source ne
ContentAnalyzer
- 搜索引擎正文提取程序,通过html分析和正则,去掉html代码,保留网页正文,只针对中文有效。英文稍加修改即可使用。-The body of the search engine extraction process, through analysis and regular html remove html code to retain the page text, only effective against the Chinese. Slightly modified to use Engl
getmainpic
- 从html页面中找出主要的图片和flash 可用于网页分析 图片搜索-Html page to find out from the main picture and the flash can be used for web analytics Image Search
ComboBox
- 类似与google搜索条的下拉列表..能模糊查找-Google search bar similar to the drop-down list .. can fuzzy search
seo
- 搜索引擎优化:搜索引擎优化——SEO从入门到精通——PDF版下载-Search Engine Optimization: Search Engine Optimization- SEO from entry to the master- PDF version download
AnalyzerViewer_source
- Lucene.Net is a high performance Information Retrieval (IR) library, also known as a search engine library. Lucene.Net contains powerful APIs for creating full text indexes and implementing advanced and precise search technologies into your programs.
Crawler_src_code
- 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
VB_URL_str_parser
- 从html文件中分离出URL地址,如搜索引擎一样,将URL地址从文件中分离出来-Html file from the URL address of isolated, such as search engines, the URL address will be separated from the document
Manning.Lucene.in.Action
- Lucene是一个开源世界瑰宝- 高度可扩展的,快速的搜索引擎。它提供的性能,是disarmingly易于使用。在行动Lucene是Lucene的权威指南。它描述了如何索引你的类型,包括你一定要知道,如MS Word,PDF格式,HTML和XML数据。它向您介绍了搜索,排序,筛选,突出搜索结果。 -Lucene is a gem in the open-source world--a highly scalable, fast search engine. It delivers perfo
yioop-v0.76
- Yioop! 是一个 PHP 的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, 以及 sitemaps。 Yioop! Version 0.76 发布,该版本增加了获得Yioop! 之外的搜索结果的函数API,提高了RSS响应,允许包含图片。加强了在线文档,简化了arc_tool同步,修复了导致大型索引崩溃的目录输出缓冲的一个