搜索资源列表
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
javazip_src
- 本软件是在JDK1.4环境下开发完成,因此您最好在JDK1.4及以上版本中运行它。程序已经实现了打开、导出、添加、删除、关闭 、内置的文本浏览器、语言识别、界面切换、按文件名、按时间等排序、日志记录、完整的菜单快捷键等基本功能-This software is developed under JDK 1.4, so you might want in the JDK 1.4 and above versions run it. Procedures have achieved open, exp
javazip_src
- 开源Winzip压缩工具Java版源码。本软件是在JDK1.4环境下开发完成,因此您最好在JDK1.4及以上版本中运行它。程序已经实现了打开、导出、添加、删除、关闭 、内置的文本浏览器、语言识别、界面切换、按文件名、按时间等排序、日志记录、完整的菜单快捷键等基本功能。-Open-source version of Java source code compression utility Winzip. This software is developed in the JDK1.4 enviro
OCR
- Executable jar , for simple text recognition Example
voicexml_phone_survey_src
- VoiceXML is a markup language for creating voice-user interfaces. It uses speech recognition and/or touchtone (DTMF keypad) for input, and pre-recorded audio and text-to-speech synthesis (TTS) for output. It is based on the Worldwide Web Consortium s
html-extractor
- 发布一个HTML正文提取程序HTMLExtractor, 程序主要是基于内容统计的方法,暂不包含自学习能力,仅是 一个分析程序而以,网上也有别人实现了的正文提取程序,不过 大部人都当宝,都不愿意公开完整代码,有些大人实现了一些简 单的,不过分析能力和识别能力都不太理想。所以自己做了一个 简单的,本来想用PHP DOM分析器,不过大部份网页都不规范, 缺个标签啥的都很正常,所以自已又造了个简单的轮子分析HTML标 签,功能比较简单,每个元素都生成一个对象,内存方面占用比
VietOCR-3.1.2-src
- Descr iption: A Java/.NET GUI frontend for Tesseract OCR engine. Supports optical character recognition for Vietnamese and other languages supported by Tesseract. VietOCR is released and distributed under the Apache License, v2.0. Fe
IOTest
- 调用orc引擎进行文字图像识别,识别率60 -80 -Call the orc engine text image recognition, the recognition rate of 60 -80
ocr
- ocr图片文字识别技术,对图片中的文字进行中文识别。-ocr image text recognition technology
JavaOcr
- 基于java环境下的ocr文字识别代码。支持中文字符的识别。-Code java ocr text recognition based environment. Support the identification of Chinese characters.
TextAnalysis
- OCR文字识别中可用的选择文本框组件, 1、功能点击某个可能错误的字列出该字的可能的文字列表 2、替换文本中的某个字 3、文本中映射对应的图片显示-OCR text recognition, select the text box components available, 1, the function may be the wrong word click on a list of possible words in the word list 2, replace
javazip_src
- 开源Winzip压缩工具Java版源码。本软件是在JDK1.4环境下开发完成,因此您最好在JDK1.4及以上版本中运行它。程序已经实现了打开、导出、添加、删除、关闭 、内置的文本浏览器、语言识别、界面切换、按文件名、按时间等排序、日志记录、完整的菜单快捷键等基本功能。--Winzip compression tool open source version of Java source code. This software is developed under JDK1.4 environme
collectphp
- 链接智能识别 (识别包括带http的链接,相对的链接,绝对的链接) 文本采集 内容分页采集 图片自动采集 文字自定义替换 自定义去除html相关标签 数据导出为sql 批量生成缩略图-Link intelligent recognition (identification includes links with HTTP, relative links, absolute links). Text collection Content page coll
bmf4
- 扫描目录自动添加表情 (2006年5月28日) 可设置无文字帖子内工具栏 (2006年5月27日) 增强 Tags 重新统计系统 (2006年5月27日) 新增图片对齐 BMB Code [img=align](2006年5月26日) 可视化发帖的兼容性和代码识别率 (2006年5月22日) 单贴可多次评分 (2006年5月21日)-Automatically add the scan directory (May 28, 2006) Can be set without
网店工商信息图片文字提取
- java图片识别文字java文字识别程序的关键是寻找一个可以调用的OCR引擎。tesseract-ocr就是一个这样的OCR引擎,(Java picture recognition text)