搜索资源列表
SimpleBT0.1.7-src
- 一个简单的BT下载实现,用Python语言编程,支持中文界面。
testPost
- 一个简单的Python post表单提交,获取相关网页源码,可以通过数据字典的加入来获取相关局域网内的路由器密码和账号。- A simple Python post form submission for web source, added through the data dictionary to obtain the relevant LAN router password and account. 中文(简体) 日语
Python_Search_Engine
- python实现的快速并行中文搜索引擎。-python achieve fast parallel Chinese search engine.
catch_image-master
- catch_wall_street_journal_mansion_image-master python 的爬虫,抓起华尔街日报中文网站豪宅图-catch wall street journal mansion image master
ebookSpyder
- 小说类爬虫的集合,这类网页的特征是需要提取的文本特别多, 特别是中文,解析却相对简单,涉及的js较少 **思路**:爬目录页,解析各章节链接,爬各章节,解析,保存到txt里 大部分的小说当然不是自己看啦,主要拿来练习爬虫和做文本分析用(Novel collection of reptiles, the characteristics of such pages is the need to extract the text in particular, Especially in Chi
Information_retrieva_Projectl--master
- python 中文信息检索系统 网页爬取 倒排索引(Python Chinese information retrieval system)
jieba-0.38
- jieba 分词,用在Python中,对中文文本进行分词(Jieba participle, used in Python to segment Chinese text;)
pyltp
- 调用哈工大的语言云平台lpt进行中文分词处理,支持自定义词典(Word segregation is the process that cutting the string of natural language into words.you can use this to syncopate words)
《Python+Cookbook》第三版中文v2.0.0
- 用于学习python与cookbook的一本书,适用于python小伙伴(A book for learning Python and cookbook, for Python buddies)