搜索资源列表
pstotext-1.9.tar
- Postscr ipt格式转为文本格式(text extractor)的C源代码-Postscr ipt format to text format (text extractor) C source code
final
- 将一行手写体汉字切分成单独的汉字,为接下来的汉字识别工作打基础。-Line handwritten Chinese characters will be cut into separate Chinese characters, Chinese character recognition for the work of the next foundation.
AbsorbWords
- 根据格式文档特征,提取文档中的特定字符。-Words extractor Very useful project developed with Java, it can be used to extract all kinds of words from your text files.
html-extractor
- 发布一个HTML正文提取程序HTMLExtractor, 程序主要是基于内容统计的方法,暂不包含自学习能力,仅是 一个分析程序而以,网上也有别人实现了的正文提取程序,不过 大部人都当宝,都不愿意公开完整代码,有些大人实现了一些简 单的,不过分析能力和识别能力都不太理想。所以自己做了一个 简单的,本来想用PHP DOM分析器,不过大部份网页都不规范, 缺个标签啥的都很正常,所以自已又造了个简单的轮子分析HTML标 签,功能比较简单,每个元素都生成一个对象,内存方面占用比
xpdf-0.5.tar
- xpdf-0.5.tar.gz Xpdf是一个开放源码阅读器,便携式文档格式(PDF)文件。 Xpdf项目还包括一个PDF文本提取,PDF格式到Postscr ipt转换,以及其他各种实用工具。-Xpdf is an open source viewer for Portable Document Format (PDF) files. (These are also sometimes also called Acrobat files, from the name of A
xpdf-0.6.tar
- xpdf-0.6.tar.gz Xpdf是一个开放源码阅读器,便携式文档格式(PDF)文件。 Xpdf项目还包括一个PDF文本提取,PDF格式到Postscr ipt转换,以及其他各种实用工具。-Xpdf is an open source viewer for Portable Document Format (PDF)files. (These are also sometimes also called Acrobat files, from the name of Adobe
xpdf-0.7.tar
- xpdf-0.7.tar.gz Xpdf是一个开放源码阅读器,便携式文档格式(PDF)文件。 Xpdf项目还包括一个PDF文本提取,PDF格式到Postscr ipt转换,以及其他各种实用工具。-Xpdf is an open source viewer for Portable Document Format (PDF)files. (These are also sometimes also called Acrobat files, from the name of Adobe
xpdf-0.80
- xpdf-0.80.tgz Xpdf是一个开放源码阅读器,便携式文档格式(PDF)文件。 Xpdf项目还包括一个PDF文本提取,PDF格式到Postscr ipt转换,以及其他各种实用工具。-Xpdf is an open source viewer for Portable Document Format (PDF)files. (These are also sometimes also called Acrobat files, from the name of Adobe s
xpdf-0.90
- xpdf-0.90.rar Xpdf是一个开放源码阅读器,便携式文档格式(PDF)文件。 Xpdf项目还包括一个PDF文本提取,PDF格式到Postscr ipt转换,以及其他各种实用工具。-Xpdf is an open source viewer for Portable Document Format (PDF)files. (These are also sometimes also called Acrobat files, from the name of Adobe s
xpdf-1.00.tar
- xpdf-1.00.tar.gz Xpdf是一个开放源码阅读器,便携式文档格式(PDF)文件。 Xpdf项目还包括一个PDF文本提取,PDF格式到Postscr ipt转换,以及其他各种实用工具。-Xpdf is an open source viewer for Portable Document Format (PDF)files. (These are also sometimes also called Acrobat files, from the name of Adobe
web-text-extractor
- 网页正文提取,包含java,perl,和php版本-Web text extraction
words.tar
- 内容提取器,从规定内容的文本中提取出特定的部分-Content extractor extracts from the text of a specific portion of the predetermined content
Apache-POI-3.9
- 参考手册必须大于多少个字多少个字字字多少个20字多少个20字多少个20字(POIDocument This holds the common functionality for all POI Document classes. POIOLE2TextExtractor Common Parent for OLE2 based Text Extractors of POI Documents, such as .doc, .xls You will typically find the im
