CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 Internet/网络编程 搜索引擎 搜索资源 - 数据处理

搜索资源列表

  1. 万维网上数据处理方法的研究

    0下载:
  2. 万维网上数据处理方法的研究 Master Thesis DSHEN inChinese-on the World Wide Web Data Processing Method of Master Thesis DSHEN inChin ese
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:737154
    • 提供者:none
  1. free141full

    0下载:
  2. 这个系统属于自动化的搜索引擎,它可以从一个网址列表开始,自动寻找这些网址的下一级网页。可以让中小网站也有有自己特色的搜索引擎。适合与于对某一指定领域里的网站进行搜索,比如建立一个内网的搜索引擎。 升级内容: 1.增加屏蔽网址功能 。 2.修正上一版本处理网页重定向时判断部分网址的错误。 3.增加了删除重复数据功能,可选择是否采用重复页面删除模式,可定义索引重复数据的数据表。 4.首次采用注册码注册完全版本,共享版本限制每网址索引10个页面。 -this system i
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:115875
    • 提供者:李文超
  1. turbo_cwcshop

    0下载:
  2. 系统搭建在Utility-Layer Framework之上 整个系统基于UTF8编码,全面国际化支持,适合任何语言 商城适合销售任何商品 顾客购物流程非常流畅,不产生阻塞感,有良好的购物体验 (Utility-Layer Framework特性之一) 支持注册和非注册用户购物 优良的缓存特性和特别的异步更新数据设计提供了大负载的支持 (Utility-Layer Framework特性之一) 对GOOGLE有最好的亲和度 - 通过独特的URL重写技术,对所有商品页面和
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:7320756
    • 提供者:wenwu
  1. MailExtractor

    0下载:
  2. 本套软件的最大特色是可以让你随心所欲的添加自己心仪的网站进行搜索,大至国际著名的搜索引擎、商贸网站,小至个人网站都可以进行搜索。你自己可以进行数据的处理,使搜索出来的客户群更加符合你的要求。-the software is the most significant feature allows you to add their own attained the ideal site search, to the world's leading search engine, commerc
  3. 所属分类:搜索引擎

    • 发布日期:2008-10-13
    • 文件大小:2915043
    • 提供者:麻烦可
  1. 03

    0下载:
  2. 本文首先介绍了图像搜索引擎系统的总体设计,分别介绍了数据下载模块、 预处理模块、图像分类模块、图像检索模块。在分析Spider系统的总体架构、运 行流程和重要组件的基础上,实现了普通爬虫和精确爬虫,分别针对不同的网页 进行数据下载。-This thesis describes the overall design of the image search engine firstly and describes the data download module、preprocess
  3. 所属分类:Search Engine

    • 发布日期:2017-05-14
    • 文件大小:3968334
    • 提供者:武燕
  1. 10121

    0下载:
  2. 利用虚函数手段,按照三种不同的数据存储方式及其处理方法来实现如下的所谓“反序 输出问题”:从键盘输入n 个int 型数据先存储起来(具体n 值由用户从键盘输入),而后再 按照与输入相反的顺序将这些数据显示在屏幕上。 具体地说,可通过在基类baseCla 及其派生类method1Cla、method2Cla 和method3Cla 中说明如下的同一个虚函数“virtual void reverseout() ”,来实现所述问题的三种不同处 理方法。例如,可设计并使用已经在第四章
  3. 所属分类:Search Engine

    • 发布日期:2017-04-12
    • 文件大小:1073
    • 提供者:俊鹏
  1. Crawler_src_code

    0下载:
  2. 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
  3. 所属分类:Search Engine

    • 发布日期:2017-03-22
    • 文件大小:55299
    • 提供者:lisi
  1. collect

    0下载:
  2. 简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度-Simple collection reptiles# 1. I have only had a collection of url feature, if y
  3. 所属分类:Search Engine

    • 发布日期:2017-03-30
    • 文件大小:5192
    • 提供者:wangyh123
  1. ICTCLAS2010CSharpDemo

    0下载:
  2. 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
  3. 所属分类:Search Engine

    • 发布日期:2017-03-29
    • 文件大小:93050
    • 提供者:Liuying
  1. Search

    0下载:
  2. 进行点云数据处理是需要进行中邻域搜索算法,上传的是K邻域搜索算法-For point cloud data processing is needed in the neighborhood search algorithm, upload the K neighborhood search algorithm
  3. 所属分类:Search Engine

    • 发布日期:2017-03-23
    • 文件大小:6273
    • 提供者:sad
  1. Simple-collection-of-reptiles

    0下载:
  2. 简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度- Simple collection of reptiles # 1 I just made a collection of URL functi
  3. 所属分类:Search Engine

    • 发布日期:2017-03-28
    • 文件大小:4498
    • 提供者:jt
  1. 用Python写网络爬虫

    2下载:
  2. 本书讲解了如何使用P川lOil来编写网络爬虫程序, 内容包括网络爬虫简 介, 从页面中抓取数据的三种方法, 提取缓存中的数据, 使用多个线程和进 程来进行并发抓取, 如何抓取动态页面中的内容, 与表单进行交互, 处理页 面中的验证码问题, 以及使用 Scarpy和Portia 来进行数据抓取, 并在最后使 用本书介绍的数据抓取技术对几个真实的网站进行了抓取, 旨在帮助读者活 学活用书中介绍的技术。 本书适合有一定Python 编程经验, 而且对爬虫技术感兴趣的读者阅读。(This book ex
  3. 所属分类:搜索引擎

    • 发布日期:2018-01-09
    • 文件大小:14773248
    • 提供者:prvllue
搜珍网 www.dssz.com