搜索资源列表
Tightly-Packed-Tries
- Tightly Packed Tries: How to Fit Large Models into Memory, and Make them Load Fast, Too We present Tightly Packed Tries (TPTs), a compact implementation of read-only, compressed trie structures with fast on-demand paging and short load times. We de
analyze_ngrams.py.tar
- analyzes n-gram coverage. it takes a full n-grams list and an extracted n-grams list and reports the coverage
n-gram
- 用perl语言,通过n-gram算法,实现自然语言处理中的汉语切分问题-Perl language used by the n-gram algorithm, natural language processing problems of Chinese segmentation
NGram
- java 实现基于N-gram的文本分类算法-java based N-gram-based text classification algorithm
ngramtool-20040527-mingw32-static
- 在Windows环境下,可以对大规模语料进行n-gram统计,并且可以删除冗余子串。-In the Windows environment, you can carry out a large-scale corpus based n-gram statistics, and you can held redunction of substring.
ngram模型分词与统计算法
- N-Gram(有时也称为N元模型)是自然语言处理中一个非常重要的概念,通常在NLP中,人们基于一定的语料库,可以利用N-Gram来预计或者评估一个句子是否合理。另外一方面,N-Gram的另外一个作用是用来评估两个字符串之间的差异程度。这是模糊匹配中常用的一种手段。本文将从此开始,进而向读者展示N-Gram在自然语言处理中的各种powerful的应用。(N-Gram (sometimes referred to as N metamodel) is a very important concept
自然语言处理课程设计代码
- 一、宋词词频统计:语料库:ci.txt 要求:编程序,输入ci,自动分析统计ci.txt,统计宋词的单字词,双字词等。统计后,输出的是单字词和双字词的词典文件。文件中包括相应的词和频度(次数)。 二:宋词自动生成:语料库:ci.txt 要求:输入词牌,基于宋词的词典和宋词的词牌,可以随机或者按照语言模型,自动生成宋词。设计相应的Ui或者Web界面。 四、中文词法分析系统:语料库:1998-01-2003版-带音.txt 要求:根据构建的单词词典和双词词典,用n-gram模型,或者前向最