搜索资源列表
万维网上数据处理方法的研究
- 万维网上数据处理方法的研究 Master Thesis DSHEN inChinese-on the World Wide Web Data Processing Method of Master Thesis DSHEN inChin ese
firtex_beta102_src
- FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(100G网页,11G纯文本的索引)上检索,仅使用十几M内存在数毫
cn700-so
- ReadyGo全能搜索引擎--一网在手,天下全掌握整合各大搜索引擎,优化关键字,用户体验更佳。全源码奉送。很不错-ReadyGo almighty search engine -- a net in hand, grasp the world-wide integration of the major search engines, Optimization of keywords, the user experience better. Complimentary entire source.
Crawler_src_code
- 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
SmartSOSO
- 智能搜索引擎(Smart Hunter) 是根据目前搜索 引擎的发展趋势,除提供传统的全网快速检索、相关度排序等功能外,还提供用户角色登记、 用户兴趣自动识别、内容的语义理解、智能化信息过滤和推送等功能,为用户提供一个真正 个性化、智能化的网络信息搜集工具-Intelligent Search Engine (Smart Hunter) are based on current trends the search engine, in addition to providing tr
windows_JNI_32
- 这是中科院的分词软件,内容很全,有使用说明,及相应的demo,用于中文NLP领域的预处理,非常好!-This is the Chinese Academy of Sciences of the segmentation software, content is very wide, there are instructions for use, and the corresponding demo, pre-processing for Chinese NLP areas, very good!
Web-Crawlers
- 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。 -Web crawler (also known as web spider, robot, in the middle of the FOAF community, more often referred to as Web Chaser), is one kind of in acco
