搜索资源列表
SkypeClient
- 1、支持无限级分类,无限添加网站; 2、动态生成HTML网页文件; 3、动态生成静态搜索目录,大大减轻了服务器负担; 4、对每一个登录网站进行审核管理; 5、搜索关键词具有空格分别功能,例如:“电脑 游戏”搜索引擎会找出 关于“电脑”和“游戏”的网站; 6、方便使用的网页模板,随时做出您的个性化网页; 7、动态设置网站在搜索结果、分类目录里的排名排序; 8、可以设置登录的网站出现在多个不同分类目录上,而不需要多次登录-a support unlimited c
firtex_beta102_src
- FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(100G网页,11G纯文本的索引)上检索,仅使用十几M内存在数毫
incSpideraspnet
- 蜘蛛登陆追捕器 (网络版)0.12 版 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引擎收录的收录情况等等有相当重要的作用。
javaSearch
- 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
12spider
- 网络蜘蛛源码。 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页 ,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎 派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网 站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级 越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同 一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引 擎收录的收录情况等等有相当重要的作用。-Spider-source ne
ContentAnalyzer
- 搜索引擎正文提取程序,通过html分析和正则,去掉html代码,保留网页正文,只针对中文有效。英文稍加修改即可使用。-The body of the search engine extraction process, through analysis and regular html remove html code to retain the page text, only effective against the Chinese. Slightly modified to use Engl
getmainpic
- 从html页面中找出主要的图片和flash 可用于网页分析 图片搜索-Html page to find out from the main picture and the flash can be used for web analytics Image Search
Crawler_src_code
- 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
crawl-0.4
- c语言实现的html爬虫,开发网页爬虫的参考资料-c language implementation of the html reptiles, developing web crawler reference! ! !
test1
- 将获取的网页文本除去html标签,从而获得正文内容。-Page text html tags will get removed to obtain the text content.
北山软件简易搜索引擎 v2.0 _asp源码
- 本搜索引擎可实现对本地html/htm网页文件的类容进行搜索。可以自由设置搜索偏好。最大的特点是可以实现多关键字搜索,个各关键字之间采用空格分隔(多个连续空格或制表符算做一个空格)。点击结果页面相应文件文字可利用操作系统默认关联的应用程序将文件打开。(The search engine can search for the class contents of the local html/htm web page file. Free search preferences. The bigges
433IE
- 使用了没用的IE7内核,支持在网页内搜索,不会打开IE浏览器,还可以打开HTML文件