搜索资源列表
POSTagger
- (1)从已经标注好词性的语料中统计得到词性标记的二元转移矩阵,以及每个词以确定的词性标记出现的次数等数据(训练阶段) (2)利用动态规划算法快速选取词性标记路径,得到词性标记结果 (3)可以选择不同的词性标记集 -(1) from the good part-of-speech tagging has been the Corpus statistics to be part of speech marking the transfer of binary matrix, a
HanZiFreq
- 汉字字频统计软件说明: 1. 这个小工具可以对一个文本文件中出现的汉字的字形数和字种数进行频次统计; 2. 字频统计结果按照降序输出; 3. 可同时选中多个文本文件进行字频统计; 4. 程序启动后点击主菜单中“统计字频”下“选取文件”就可以开始进行字频统计; 5. 统计结果保存在HanZiFreq_Result.txt文件中; 6. 这个工具不能处理非纯文本格式的文件(比如rtf,word .doc文件等),并且只能处理GB码的文件。 7. \test目录下有一
1
- 遗传算法 MATLAB word文档 逐步分析 内容丰富-Genetic algorithm
simple-isolated-word-recognition
- 可以实现简单孤立词的识别和训练,内有1到9的录音,可以自己训练。-Can achieve a simple isolated word recognition and training, there are 1 to 9 of the recording, you can own training.
ChineseSegment
- 一个完整的中文分词程序,有源码,词典,训练集。算法简洁高效,准确率高。包含了一种将标注语料和词典融合的新型分词方法。将语料分割为2:1为训练集和测试集,加上一个外部词典,准确率可以达到95 。适合入门者学习。也适合需要一个简单分词工具的应用。-A Chinese word segmentation procedures, source, dictionary, the training set. The algorithm is simple and efficient, high accura
JRKIM
- 自己写的英文无空格的分词代码,只是个小例子,加入了1阶语言模型的分享,仅供参考-English to write their own code word with no spaces, just a small example, adding an order to share language models for reference
CWSS17.1.1.4
- 基于隐马尔科夫模型的中文分词系统,上交ieee专业大一作业,界面一般,主要用于学习,在此分享,注:开发环境python3.5(Based on Hidden Markov model of Chinese word segmentation system, on the IEEE professional freshman job, interface is common, mainly used for learning, in this share, note: development en
game
- 电视节目中的”你来比划我来猜“大家应该都看过,而且很多人也玩过,规则就是一个人看词语比划相应动作和说一些提示,另一个人看不到词语要通过比划的动作猜出来,猜的过程中主持人判断是否符合规则。 某一组玩家猜词语的算法设计为: 1.开始计时--->2.猜词语--->3.答对则正确数加1并回到2,要跳过或犯规了则直接回到2,超时了直接跳到3--->3.循环10次后或时间结束后统计答对的题数 有num组玩家就进行以上流程的num次循环,当然也要准备x组词语,因为每组玩家猜的词语是不同