搜索资源列表
Classifier4J-0.6-dist
- 可用于文本分类的贝叶斯分类器,java开源项目-can be used for text classification Bayesian classifier, java open source projects
ToolForReadText
- It is a software which can be used to open some file and edit it-It is a software which can be used to open som e file and edit it
personNER
- 基于CRF(conditional random fields)统计模型的文本人名识别工具源代码,是Mallet开放源码项目的一部分-based on CRF (conditional random fields) statistical model of text my name recognition tools source code, open source Mallet is part of the project
download=tidy
- jobo, famous crawler open source which is implemented by java. used in many big websites. You will need a Java Runtime Environment 1.3 or later (on many System Java 1.2 is installed, it will NOT work !).
ctoj
- 中文转日本汉字的软件。请把输出的问题用ie打开,并选择日文编码察看。-Chinese to Japan's Chinese software. Please use the output ie open, and choose to see Japanese codes.
icu4c-4_4_1-src
- ICU是多国语言处理最权威的跨平台跨语言开发包,涉及多语种处理的方方面面。也是Unicode组织官方推荐的开发包。Java底层的多语言处理就是采用ICU4j。因为Java内核已经集成进去了,Java程序员可以在这方面少花许多脑筋。 一句话,如果用C++处理文本编码问题,ICU4c是不二之选。-ICU was originally developed by the Taligent company. The Taligent team later became the Unicode grou
OptionWord
- 分析word的例子程序,打开关闭word,操作字体,设置页眉页脚等-Analysis of examples of word process, open the turn off word, operating fonts, header, footer and other settings
Text_editor
- 文本编辑器,具有以下功能:编辑文本;保存、打开指定位置的文本文件;具有输入输出界面。-Text editor, has the following functions: text editing preservation, open the text file specified location with input and output interface.
Lucene.Net.Analysis.Cn
- Lucene是什么? Lucene是Apache组织的一个用JAVA实现全文搜索引擎的开源项目。后来有人将Lucene移植到。Net语言。 Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能。 Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能。 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅
CRF-0.53
- crf++-0.53.zip CRF++ is a simple, customizable, and open source implementation of Conditional Random Fields (CRFs) for segmenting/labeling sequential data. CRF++ is designed for generic purpose and will be applied to a variety of NLP tasks, such as N
scws-1.1.7
- scws,中文分词,开源,机械分词法,简单分词-scws, Chinese word segmentation, open source
InfoJBack
- OpenCL (Open Computing Language) framework
ICTCLAS2012
- ICTCLAS的最新版本2012. 1.增加了CICTCLAS部分函数 2.修正了部分再UTF-8下计算位移偏移量的Bug. 3.ICTCLAS完全兼容开源搜索引擎Sphinx,具体可以访问Sphinx官网; 4.为保障用户使用的便利,从本版开始,调用的dll的名称一律为ICTCLAS2011.dll,不再变化,一般用户只需要变更dll及对应的.user授权文件,无需重新编译自己的程序,即可兼容新版本分词程序。 -ICTCLAS the latest version 2
pfr199801
- PFR人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。为了促进中文信息处理研究的发展,我们三方计划公开PFR语料库。作为公开的前期工作,从4月3日起,在我们三方的主页上免费公开PFR语料库1月份的语料,欢迎大家下载。PFR语料库的制作规范参阅《现代汉语语料库加工――词语切分与词性标注规范》。如果您在研究或论文工作中使用PFR语料库,请注明来
matlab-gui
- Matlab program for railway abnormal detection and imaging,including GUI, open dlg, processing dlg and source code.
word2vec-source
- word2vec是Google开源的一款处理自然语言的工具。-word2vec is a tool Google open source natural language processing
freetype-2.4.9
- FreeType库是一个完全免费(开源)的、高质量的且可移植的字体引擎,它提供统一的接口来访问多种字体格式文件,包括TrueType, OpenType, Type1, CID, CFF, Windows FON/FNT, X11 PCF等-FreeType library is a completely free (open source), high-quality and portable font engine, which provides a unified interface to
novena_pvt2
- Novena open source laptop schematics and design files
senoko-batteryboard-pvt1
- senoko battery board design files for Novena open-source laptop