搜索资源列表
ictclas_Source_Code
- 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
pspydict0[1].3src
- PSP YDICT ver0.3 改进的功能 1。在《牛津现代英汉双解词典》中,正确显示音标。 (对YDICT ver0.2版本的《牛津现代英汉双解词典》的词库,作了部分修正。) 2。在单词右侧标示出不同难度,CET4,CET6,TOEFL,GRE,方便记忆。 CET4及以下难度,绿色标记 CET6, 浅蓝色标记 TOEFL, 黄色标记 GRE, 紫色标记 3。可以标记已查过的单词,翻阅已查单词。类似标签功能。 在当前单词的解释最后一页,按一次“X”
tagging
- nlp 用隐马可夫实现语料标记,并对结果进行测试
word_pos
- 中文词性标注子程序第一步,将测试文本加入词性标记集、词语标记集、标记同现集,VFP源码
ICTPOS3.0.rar
- 中科院中文分词程序ICTCLAS的汉语词性标记集,Chinese word segmentation procedure, Chinese Academy of Sciences of the Chinese part of speech tag ICTCLAS Set
POSTagger_Src
- 包含了词条及其词性标记,频度信息的词典 练语料的格式要求: 每个词以 / 分隔, / 后是该词的词性标记。词性标记后至少要有一个空格。一个句子的所有词必须在同一行中。击“开始词性标注”选取文本文件(一次可以选择多个)进行标注处理-Includes a term and its part of speech marks, the frequency of information and training Corpus dictionary format requirements: Each w
POStag
- 词性标注。首先根据预料库训练模型,然后用得到的模型对未标记词性的语句进行词性标注。-Part of Speech Tagging. First, according to the training model is expected to libraries, and then get the model right part of speech of the statement is not marked for POS Tagging.
ACWPS
- 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。-The word is the smallest independent activities meaningful language component. But Chinese is the word as the basic unit of writing, there is no obvious mark of distinction b