搜索资源列表
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
NewFolder
- text file in java that called canny detection
charsetDetect
- 文本文件编码检测(charset detect)工具。提供单一api。特别适用于爬虫(spider)检测html编码-Text file encoding detection (charset detect) tools. Provides a single api. Especially for reptiles (spider) html code detection
wordCount
- 代码功能:文件中的词频检测,一个文件中存储待检测文本,另一个文件中存储检测的单词,且单词可为多个,检测中单词的单复数为同一单词,且能检测数字、数字与字母组合的单词- Code Function: document word frequency detection, a file stored text to be detected, another file storage detection of words, and words can be multiple, detection of
package-javaapplication1
- 1. 输入字符串sV后,将其中的标点符号(, . ! ?)转换成空格 。全部字符转换为小写字母; 2. 字符级检测:全部字符为小写字母、数字或空格; 3. 再次创建Scanner对象,从sV中扫描词组,= new Scanner(sV) ,用next()方法,将词组存放到字符串数组sVa[]中; 4. 词组级检测:剔除纯英文字符串以外的非法字符串; 5. 排序,剔除相同的英文单词,输出。 测试文本: The USB 3.0 specification was published on 12
language-detection-master
- 对输入的文本检测其语种,输出语种和确信度代码(Detects the language of the input text, the output language, and the confidence code)