搜索资源列表
一种新的基于统计的自动文本分类方法
- 一种新的基于统计的自动文本分类方法-based on a new statistical method of automatic text classification
43554TheResearchandDesignofSearchEngine
- 搜索引擎的研究与设计.rar The Research and Design of Search Engine 吉 林 大 学 硕 士 学 位 论 文 搜索引擎(Search Engine)是一个对互联网上的信息资源进行搜集整理, 然后供用户查询的系统,它包括信息搜集、信息整理和用户查询三部分,以目 录分类或全文检索的方式来提供查询服务。本文提出了一种简化的向量空间检 索模型,通过统计主题词条对文档的贡献度来建立倒排序索引库,为用户提供 智能的检索服务。-search
SogouW.20061127
- 互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。 语料库统计的意义:反映了互联网中文语言环境中的词频、词性情况。 应用案例:中文词性标注、词频分析等。 词性分类: N 名词 V 动词 ADJ 形容词 ADV 副词 CLAS 量词 ECHO 拟声词
Multiplycounter
- 可以记录来访客的来源IP地址和来源页面信息,在线人数,每月、每天和每小时的访问数据统计,搜索引擎统计,还可以自己定义搜索引擎-record visitors to the source IP address and source of pages of information, the number of online per month, daily and hourly visit statistical data, the search engine statistics, but als
ProgrammingPCollectivePIntelligence
- 本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过
zhizhu_v1.0
- 扎鸟搜索引擎蜘蛛爬行统计系统。搜索引擎蜘蛛的跟踪记录,主要有 百度,谷歌,搜搜,搜狗,360,雅虎,Bing,有道,Alexa,搜索引擎蜘蛛,能准确抓取并记录。-Tie bird search engine spiders crawl the statistical system. The track record of the search engine spiders Baidu, Google, Soso, Sogou, 360, Yahoo, Bing, the proper way,
LLFenxi
- 一、查看来源记录 1.记录从上一页访问到本页,让你知道是从哪里来的 二、来源页面排名 1.外来链接排名 2.统计外来链接,看看哪个网站链接过来的更多。 三、受访页面排名 1.统计访问最多的页面,可以知道哪一页更受欢迎! 四、独立IP排名 1.记录IP地址。 2.记录IP物理地址。让你知*友们是从何处而来。如:219.234.*.* 北京市 中关村数据网 3.独立IP排名。看看谁更注意你, 五、当天关
