CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 其它 中文信息处理 搜索资源 - term

搜索资源列表

  1. ictclas_Source_Code

    0下载:
  2. 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:113239
    • 提供者:郑昀
  1. CDevideSentence

    0下载:
  2. 用c++写的分词算法,简单,实用,详情看里面的帮助文件!-using c + + to write the sub-term algorithm is simple, practical, inside look at the details of the help files!
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:91579
    • 提供者:徐科
  1. wordpos

    1下载:
  2. 给定带有分词和词性标注信息语料,从中总结单词的词频,并按照出现次数排序输出-given with sub-term and part-of-speech tagging information corpus, it is concluded that the words and phrases, and in accordance with the order of the output frequency
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:44995
    • 提供者:gloria
  1. WordSegMM

    1下载:
  2. 中文最大匹配分词源码-matching the largest Chinese-term source
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:64125
    • 提供者:邹加棋
  1. Qiyi

    0下载:
  2. 最大概率法分词的数据结构与算法,用这样的方法分词可以提高分词中歧义词的辨别率,非常经典啊-greatest probability - term data structure and algorithm, this approach can increase Word word-of ambiguous words in the identification rate, very classic ah
  3. 所属分类:中文信息处理

    • 发布日期:2008-10-13
    • 文件大小:1165
    • 提供者:月月
  1. pymmseg.用python写的分词程序

    0下载:
  2. 用python写的分词程序,实现的是最大匹配方法,简单易用,Using python to write the sub-term process of implementation is the largest matching method, easy-to-use
  3. 所属分类:中文信息处理

    • 发布日期:2017-03-22
    • 文件大小:693094
    • 提供者:周光有
  1. CJKAnalyzer.分词系统(JAVA开发

    0下载:
  2. 一个很好用的分词系统(JAVA开发),词表可以扩展。,A good word to use the sub-system (JAVA development), the term sheet can be extended.
  3. 所属分类:中文信息处理

    • 发布日期:2017-03-22
    • 文件大小:3223
    • 提供者:秋水长天
  1. lzj.rar

    0下载:
  2. 给一篇文章,然后根据停用词表,去除该文章的内的次用词,然后存入一个文件中。,To an article, and then form the basis of stop words to remove the article, the second term, and then into a file.
  3. 所属分类:MultiLanguage

    • 发布日期:2017-04-01
    • 文件大小:598104
    • 提供者:张国
  1. PatTermExtraction

    1下载:
  2. 使用无监督的机器学习方法进行术语抽取的系统,具有预处理、分词、抽取术语等功能。-Unsupervised machine learning methods for term extraction system with preprocessing, segmentation, extracted terms, and so on.
  3. 所属分类:MultiLanguage

    • 发布日期:2016-12-09
    • 文件大小:689152
    • 提供者:ly
  1. splitword

    0下载:
  2. 自己写的小分词程序,中文分词测试版,仅供参考,谢谢!-Writing their own small sub-term process, English sub-test version of the word, for reference purposes only, thank you!
  3. 所属分类:MultiLanguage

    • 发布日期:2017-04-03
    • 文件大小:5415
    • 提供者:崇丽岩
  1. 2

    0下载:
  2. 清浊音检测,方法为短时平均能量,自己编的matlab程序。希望有用--Qingzhuo tone detection, methods for short-term average energy, the matlab own procedures. Hope useful
  3. 所属分类:MultiLanguage

    • 发布日期:2017-04-01
    • 文件大小:45339
    • 提供者:冬冬
  1. POSTagger_Src

    0下载:
  2. 包含了词条及其词性标记,频度信息的词典 练语料的格式要求: 每个词以 / 分隔, / 后是该词的词性标记。词性标记后至少要有一个空格。一个句子的所有词必须在同一行中。击“开始词性标注”选取文本文件(一次可以选择多个)进行标注处理-Includes a term and its part of speech marks, the frequency of information and training Corpus dictionary format requirements: Each w
  3. 所属分类:MultiLanguage

    • 发布日期:2017-03-26
    • 文件大小:174557
    • 提供者:张耀
  1. nlp

    0下载:
  2. 中文自然語言處理相關程式,包括中文字頻統計及Jensen-Shannon Divergence計算程式,並包含古典文獻範例-This rar file include natural language processing related programs, includeing Chinese term frequency statistics, Jensen-Shannon Divergence program and text examples.
  3. 所属分类:MultiLanguage

    • 发布日期:2017-04-03
    • 文件大小:103354
    • 提供者:kevin
  1. StdMis

    0下载:
  2. create database StdMis Go use StdMis Go If exists(select name from sysobjects where name="User" and type="U") Drop table User go create table T_User( UserName varchar(10) not null, Password varchar(6) not null, FullName var
  3. 所属分类:MultiLanguage

    • 发布日期:2017-03-24
    • 文件大小:195012
    • 提供者:赵亮
  1. word_split

    0下载:
  2. 这个一个基于逆向最大匹配的分词程序,语料规模比较小。-The maximum matching based on the reverse of the sub-term process, relatively small-scale corpus.
  3. 所属分类:MultiLanguage

    • 发布日期:2017-04-09
    • 文件大小:1517543
    • 提供者:nancy
  1. TF-IDF

    0下载:
  2. The tf–idf weight (term frequency–inverse document frequency) is a weight often used in information retrieval and text mining. This weight is a statistical measure used to evaluate how important a word is to a document in a collection or corpus. The
  3. 所属分类:MultiLanguage

    • 发布日期:2017-03-22
    • 文件大小:4890
    • 提供者:oplachko84
  1. NLP-test-and-amendament

    0下载:
  2. 自然語言處理作業(NLP)-期中考試卷訂正 Term Explanation(需各舉一個例子做說明)-Word-sense disambiguation In computational linguistics, word sense disambiguation (WSD) is the process of identifying which sense of a word is used in any given sentence, when the word has a numb
  3. 所属分类:MultiLanguage

    • 发布日期:2017-03-22
    • 文件大小:77957
    • 提供者:何昊天
搜珍网 www.dssz.com