搜索资源列表
pyformat
- pyformat.zip包中有两个文件夹,pyformat_src文件夹里的为源代码,pyformat_dist文件夹里的为编译后的exe可执行程序,另外每个文件夹里都放了一个名为“testfile.txt”的测试文件。 源码使用方法示例:执行\"python pyformat.py testfile.txt\"。 可执行程序使用方法示例:执行“pyformat testfile.txt”。 即可把文件名中的不带调拼音+声调记号转化为带调拼音输出到stdout。文件名可以有多个
pymmseg.用python写的分词程序
- 用python写的分词程序,实现的是最大匹配方法,简单易用,Using python to write the sub-term process of implementation is the largest matching method, easy-to-use
pymmseg-cpp-win32-1.0.1.tar.gz
- 基于python的中文分词程序,易用性高,可以作为接口直接在python程序中使用,Python-based Chinese word segmentation process, ease of use high, can be used as interface directly in the python program to use
text
- python写的gbk分词分句程序 可以使用sogou或者谷歌输入法的词库进行分词-python written procedures gbk participle clause can use Google sogou or input method for segmentation of the thesaurus
ngrams
- 自然语言处理相关程序,有关分词的和词频统计-Natural language processing procedures, the statistical segmentation and word frequency