搜索资源列表
Crawler_src_code
- 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
Scramble_List
- 字符串 匹配搜索工具 匹配给定的 scamble-list文件中的词语 在某个给定文件中出现的形式和次数 用法为 ./scrable.exe file.txt scrable.txt file.txt 和 scrable.txt 请自行提供,英文,任意大小-Match the search string matches a given scamble-list word document In a given document occurs in the fo
Python-Spider
- 针对“天天美剧”,Coursera,豆瓣 Top 250 电影列表,“免费文档”,“糗事百科”以及“挖段子”等网站的 Python 爬虫。 主要实现网站资源链接和文本内容爬取及保存。 具体用法见代码注释。-Python Reptile for " everyday drama" , Coursera, watercress Top 250 list of movies, " free document" , " embarrassmen