搜索资源列表
spider(java)
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-web crawling robots - known network (Robot), Web crawling,
cadisrch
- 查找自制的关键字数据文件中的关键字的搜索程序 -Seaching keyword in data file which contains self-made keyword
GooglePageRankQuery
- 查询Google PageRank 破解全过程 1. 装个 google工具条 开启pagerank 2. 找个网络 sniffer 软件, 运行浏览器随便打开个网站, 3. sniffer将记录 google工具条发给 google的数据包 分析可得,传输协议是 http, 数据包内除了 有访问网站的地址, 关键还有个 ch参数 , ch参数根据网站地址不同 发生变化(看来关键是 ch怎么计算出来的!) 4.分析google工具条,得到计算 ch的汇编代码,然后翻
ss
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-asp
GooglePR
- Google PageRank (网页级别) 是 Google 搜索引擎用于评测一个网页“重要性”的一种方法。 Google 通过 PageRank 来调整结果,使那些更具“重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。 主要功能: 1、Google PR值在线查询,直接读取Google官方数据; 2、小偷工具,无需维护数据; 3、DIV+CSS模板方便修改; 4、免费、开源程序 -Google PageRank (PageRan
softhy76I
- 可查询谷歌(Google)、百度(baidu)、必应(Bing)、雅虎(Yahoo)、搜搜(Soso)、搜狗(Sogou)、有道(Youdao)、AltaVista、AlltheWeb等搜索引擎最新收录数据,修正了百度无法正常取值的问题,增加了记录查询历史的功能。 -Can be found at Google (Google), Baidu (baidu), will be (Bing), Yahoo (Yahoo), search search (Soso), search dogs (
Lucene.Net
- Lucene.Net DLL及相关应用,用于查询数据索引建立-Lucene.Net DLL
totsearch
- 淘特站内搜索引擎(C#版)基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案-Amoy Special Search Engine (C# Edition) Based on Lucene.Net core, through the effective Chinese word
ProgrammingPCollectivePIntelligence
- 本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过
wailian3.0
- 网站SEO自动外链,免费在线增加外链。首先声明一下,这个程序的创意,初次代码都非本人,我只是在原有代码的基础上进行了改进和美化。最初的作者现在已经无从考证,希望谅解。 较2.0版本,3.0的改进如下: 1、新增加了20条国外站长工具查询地址,数据最后更新日期为2.19 2、全新的模板设置,更清爽的UI 声明:模板UI创意来自互联网,本人做了一些微调 -ESO source outside the chain