搜索资源列表
xianquchuchengxu
- 表单图像线去除的程序,研究了一种直线检测和字线分离的算法.采用了一种检测直线的方法,即有向单单连通链法,它定义简单,物理意义明确,易于存储和处理.且能较好处理倾斜,断裂和字线交叠的情况,且通过将游程平滑,将尺寸小的单连通链滤除,并减少连通链合并时的搜索范围,可达到算法的加速,使结果更加精确.研究了字线相交的不同情况,采用了与框线检测结合的表格框线去除和交叠文字保留的方法,以及对字线分离后的笔画部分的修整.国内做这方面东西的人都很少,资料很少 -form images line removal
OCR
- 自已编写的印刷体汉字识别程序,介绍了两种汉字切分算法:投影法,连通域合并法。 以及二值化,灰度拉伸,灰度均衡等图像处理算法(内附汉字图片进行试验)
ISODATA
- ISODATA算法是一种基于统计模式识别的,非常经典的非监督学习动态聚类算法,有较强的实用性。ISODATA算法不仅可以通过调整样本所属类别完成样本的聚类分析,而且可以自动地进行类别的“合并”和“分裂”,从而得到类数比较合理的聚类结果。-ISODATA algorithm is based on statistical pattern recognition, unsupervised learning is the classic dynamic clustering algorithm