搜索资源列表
STRTOUP
- 一个可以进行全角字符《---》半角字符转化的 C 语言函数。-a can-wide angle characters -- In the half-angle of characters into C language function.
FontGen2
- 点阵字体产生工具以及相关显示函数。 在开发嵌入式系统时,需要显示不同大小或类型字体的汉字。显然,对于嵌入式系统,不太可能使用矢量字体,而点阵字体,不同大小的字体不能简单的缩放。 另外,对一个小系统,也不需要完整的字体,往往只要几十个,甚至几个就够了。 一般,我们采用的方法是,自己准备点阵字体的数据,在显示汉字时,把这些数据写入显存就行了。 这时又存在另外一个问题,由于是不完整的字库,不能简单的用汉字的内码去找到对应的字体数据,如果逐个比较,又费时间。比较好的方法就是把字体数据
zhongwen
- C++一般的输入都不是作为宽字符集处理的,使用C++分词,如果能完成窄字符输入,但按宽字符取子串,基本上分词的问题就解决了-C++ General input is not as wide-character set handling, use C++ Participle, if we can complete the narrow character input, but by the wide-character substring check basically segmentation
ChineseTokenizer
- 中文分词演示程序,可以对字符串进行按照词义分词。在搜索技术中有广泛应用。-Chinese Segmentation demo program can be carried out in accordance with the meaning of the string segmentation. In the search technology has wide application.
NLTK
- 本书本源于国外大学课堂上的讲义,但是由于其配有相应的运行环境,获得了很好的教学效果,后编写为书。该书主要用于中文信息处理领域,对信息处理的各个子问题都进行了深入的讲解。 -The book covers a wide range of introductory topics in NLP, and shows how to do all the processing tasks using the toolkit. The toolkit s reference documentation
RESEARCH_ON_KEY_TECHNOLOGIES_OF_THE_INFORMATION_EX
- 说明:主要集中在命名实体识别和实体关系抽取两个方面,将先进的机器学习算 法和全新的理论方法一全信息理论运用到我们的整个研究过程中。-Descr iption: The main focus on named entity recognition and entity extraction between the two aspects of advanced machine learning algorithms and new theoretical methods of informat
