搜索资源列表
mlct_public
- 这是一个基于Java的分词、N-gram统计、分段 、分句等功能的程序,支持多种语言-This is a Java-based segmentation, N-gram statistics, the sub-clause of the function procedures, multilingual support
xdgf
- 字符处理这是一个基于Java的分词、N-gram统计、分段 、分句等功能的程序,支持多种语-characters to deal with this is a Java-based segmentation, N-gram to statistics, subparagraph Clauses function procedures, multiple language support
webcat
- 这是一个100 %纯Java库,您可以使用适用于N元 分析技术的过程分为文本文件。 该计划包括几个不同的分类算法, namelly 支持向量机,贝叶斯Logistic回归,神经网络分类和文本压缩 算法。如支持向量机和贝叶斯Logistic回归,一个 “一对一” 用于多类分类。更详细的说明这些学习算法和可用的选项,请提供的javadocs 。-It is a 100 pure Java library that you can use to apply N-Gr
segment
- 基于n元语法的分词。先训练后,再通过前后向最大匹配初步分词,在通过2元语法来消岐。-Based on the n-gram sub-word. The first training and then through to the maximum matching before and after the initial word, in through a 2-gram to eliminate qi.
experiment3
- 基于语言模型的音字转换说明 给定拼音串:jinjitizhigaige 可能的汉字串:紧济体质改革 经 济体制改革 使用 2-gram计算: p(CString1) =p(紧)×p(济|紧)×p(体质|济)×p(改革|体质) p(CString2) =p(经济)×p(体质|经济)×p(改革|体质) p(CString3) =p(经济)×p(体制|经济)×p(改革|体制) 比较p(CString1),p(CString2),p(CString3)
