搜索资源列表
FreeICTCLAS.rar
- 汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系
Free-Software
- 计算所汉语词法分析系统之免费版本ICTCLAS.非收费之源代码。 分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。--Calculate the Chinese Lexical Analysis System ICTCLAS. Segmentation correc
ICTCLAS
- 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009。-Institute of Computing Technology, Chinese Academy of resear
ICTCLAS50_Windows_32_C
- 中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。-New word of the Chinese Academy of Sciences Institute of Computing Technology, Chinese Lexical Ana
SSE
- SSE === small search engine implement ----2013.01.17---- 补充第一份说明,这个项目是三四个月前写的基于Lucene.Net的一个小型通用搜索引擎, 稍迟会补上Demo, 当时的目标是一个通用的索引跟检索架构。 索引方面: 每增加一种需要索引的文档类型,都只需要新建一个类,在类的各个字段上标注上索引信息(如是否需要存储,是否需要分词等)然后又数据源提供实体信息给索引器即可自动索引。
pos_tag
- 用viterbi方法进行词性标注 pos_tag.py 词性标注 evaluate.py 词性标注性能评估 PD_1998_01_POS.txt ”人民日报“语料库 标准词性标注结果.txt 语料库中后10 的数库(分词+词性标注)-Using the viterbi methods for part-of-speech tagging pos_tag.py part-of-speech tagging the evaluate.py speech tagging perform
WordList
- 北京大学分词词表,有属性,是进行分词词性标注的重要资源。-Peking word vocabulary, properties, and is an important resource for sub-word part-of-speech tagging.
gpom
- 这是一个文本标注的软件,点击它后可以对输入文本进行分词,标注-This is a text annotation software, click on it after the input text participle, labeling
ytgfc.tar
- 用python实现对文档的分词,并进行词性标注-Use python to achieve the word on the document, and voice tagging
ltp-3.3.2
- 哈工大信息检索实验室进行文本的依存分析、命名实体识别、词性标注、分词、语义依存分析、语义角色标注(dependency parse of text)
ltp-3.4.0
- 自然语言处理开源项目源代码,中文分词,词性标注等功能介绍(Natural language processing open source project source code, Chinese word segmentation, speech tagging and other functions)
hmm机器学习
- HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、词性标注及语音识别等,在NLP中占有很重要的地位(HMM (hidden Markov model) is a basic model in Natural Language Processing, which is widely used, such as Chinese segmentation, part of speech tagging and speech recognition, and plays
199801
- 人民日报语料,分词和词性标注POS的语料(Chinese corpus for Word segmentation and par of speech)
汉语分词20140928
- cltclas中文分词工具包,可以进行分词,词性标注等等(Cltclas Chinese word segmentation kit, can be participle, part of speech tagging, and so on)
CorpusWordParser
- 语料分词和词性标注软件。 软件只支持打开文本格式(.txt)的文件,其他类型文件需先另存为文本文件格式后再处理。 软件可以自动识别、处理文本文件的不同字符编码(GB或Unicode等)。(Word segmentation and part of speech tagging software. Software only supports files that open text format (.Txt), and other types of files need to be sav