搜索资源列表
SplitWord_Java
- java制作的中文分词DLL文件,是根据中科院中文分词系统C++改写的-produced by the Chinese word DLL files, under the Chinese Academy of Sciences is the Chinese word rewrite the C system
ictclas10
- 基于中科院的ICTCLAS实现中文分词系统 开发工具是JAVA.经测试,效果很好.-ICTCLAS based on the realization of the Chinese Academy of Sciences Chinese word segmentation system is the Java development tools. Tested, good results.
Mipptttpoowq
- 中文分词开源项目JAVA? 形姆执士
HLjava
- 海量中文分词java接口,原海量分词是C/C++平台开发的,这是java版的接口,如果提示过期,修改系统时间即可试用
03114726392
- 中文分词,中科院分词的改装版。使用java调用dll来实现的。
segment
- segment,一个简单的中文分词程序,命令行如下: java -jar segmenter.jar [-b|-g|-8|-s|-t] inputfile.txt -b Big5, -g GB2312, -8 UTF-8, -s simp. chars, -t trad. chars Segmented text will be saved to inputfile.txt.seg
小叮咚分词
- 小叮咚中文分词java源码
text_category
- 中文自动分类。使用spider抓取网络信息,利用lucene的分词及KNN方法。-Chinese automatic classification. The use of spider crawl network information, the use of Lucene sub-word and KNN methods.
KaiYuanIctclas
- ICTCLAC开源代码,可用在中文文本信息处理上,为信息抽取进行中文分词、词性标注处理,准确度达到85 以上,-failed to translate
ChineseWordSegmentation
- 总结了在过去的十年间中文自动分词技术的进展-the study in automatic Chinese word segmentation ,during the last decade
imdict-chinese-analyzer
- imdict-chinese-analyzer 是 imdict智能词典 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的ictclas中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供简体中文分词支持。-imdict-chinese-analyzer is a smart imdict Chinese Dictionary smart module segmentation algorithm
fenci
- 中文分词软件,JAVA源码,利用中科院ICTCLAS实现分词。-chinese words cut
ICTCLAS5.0
- 中文分词软件编程接口说明,很详细很详细。C++,C#,JAVA-Chinese word segmentation software programming interface specification, in detail
自然语言处理的最好的资源
- python,java代码,可以完成分词,训练词向量,等功能,效果突出。
MMSeg
- 中文自动分词系统,java编写,有界面。可以实现正向最大匹配FMM和逆向最大匹配B-Chinese automatic segmentation system, java write, there are interfaces. You can achieve maximum matching FMM forward and reverse maximum matching BMM