[发明专利]基于多方法去噪和连通区域分析的甲骨拓片单字定位方法在审
申请号: | 201710004322.7 | 申请日: | 2017-01-04 |
公开(公告)号: | CN107085726A | 公开(公告)日: | 2017-08-22 |
发明(设计)人: | 史小松;黄勇杰;马辉;刘永革 | 申请(专利权)人: | 安阳师范学院 |
主分类号: | G06K9/40 | 分类号: | G06K9/40;G06K9/34;G06K9/20;G06K9/32 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙)61223 | 代理人: | 潘宏伟 |
地址: | 455000 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多方 法去噪 连通 区域分析 甲骨 拓片 单字 定位 方法 | ||
技术领域
本发明涉及图像处理技术领域,特别涉及基于多方法去噪和连通区域分析的甲骨拓片单字定位方法。
背景技术
甲骨文是商朝后期用龟甲兽骨进行记事和占卜的文字,甲骨文契刻在龟甲与兽骨之上,距今已有三千多年。龟甲和兽骨上的甲骨文包含大量有用的信息,是研究中国古代语言、文化、历史的基础。因此,如何整理这些甲骨文字,从中提取出有用的甲骨文字,进而得到更有用的历史文化信息,是甲骨文研究的重点。
近几年在计算机处理甲骨文方面,很多研究机构开始建设甲骨文字库,极大地方便了甲骨文研究者的研究工作。目前国内许多学者对于甲骨文的数字化也做了很多研究,开发了一系列的软件和系统,如甲骨文输入法、甲骨文字库、甲骨文的编码技术、甲骨文的辅助考试研究等。这些研究成果很大程度上方便了甲骨学者对甲骨文的分析和研究,对古文字的分析和研究进入一个新的时代。然而在进行甲骨文的研究时,很多学者还是通过手工提取甲骨拓片上的文字做进一步研究,误差大效率低,并且甲骨文字与现代汉字无论在字形还是语义语法上都存在着显著的区别。首先,研究对象为拓片上的甲骨文,拓片年代久远,很多已经破损,字迹模糊;第二,拓片字形外部轮廓不齐,具有图画特征,大 小不一甚至有些只剩笔画;第三,拓片受扫描分辨率的影响会引起不少的质量问题;而普通汉字一般具有标准的笔画。
因此尽管目前在不同类型图像中汉字的定位与分割已提出了许多有效的方法,如基于纹理的定位方法,基于连通域的定位方法和基于边缘的定位方法,将上述几种方法相结合也是目前一种有效的研究思路,但这类方法有时候难以提取有效的文字特征。为了使算法更具稳定性,很多情况下将基于机器学习的方法与上面的方法结合起来。基于机器学习的分类算法主要通过机器学习强调文本区域与非文本区域的区别来实现分类,但检测效果对训练样本的选择有一定的依赖性。然而上述方法并不一定能全部应用于甲骨文字。如何从拓片上识别出甲骨文字会比手写汉字识别更困难。
目前有部分对拓片上甲骨文字进行识别的,如周新伦等提出采用拓扑结构来识别甲骨文字;吕肖庆等提出一种基于曲率直方图的傅里叶描述子,实现了小范围甲骨文的分类;栗青生等利用字形动态描述的方法实现了甲骨文的输入;顾绍通将数学形态学应用到拓片文字进行特征提取。而所有的这些研究均需建立在对拓片上的单个甲骨文字定位的基础上,目前关于甲骨文字定位的相关研究还较少。目前虽然提出了基于阈值分割和形态学的甲骨单字定位方法,但该方法在某些复杂背景或噪声比较严重的拓片图像中,定位效果不太理想,因此,如何在甲骨拓片上准确的定位并提取单个甲骨文字是所有研究的基础。
发明内容
本发明实施例提供了基于多方法去噪和连通区域分析的甲骨拓片单字定位方法,用以解决现有技术中存在的问题。
基于多方法去噪和连通区域分析的甲骨拓片单字定位方法,所述方法包括:
使用数学形态学中的开运算对输入的原始图像进行处理,去除所述原始图像中的背景图像,对获得的图像调整对比度,得到增强图像;
使用中值滤波算法对所述增强图像进行去噪处理,获得去噪图像;
利用大津法选取合适的分割阈值,使用该分割阈值对所述去噪图像进行分割,并对分割后的图像进行二值化处理,获得分割后的二值化图像;
使用数学形态学中的开运算对所述分割后的二值化图像进行去噪处理,得到开运算处理后的二值化图像;
使用bwlabel函数,按照8连通将所述开运算处理后的二值化图像中的各个连通区域标记出来,并用矩形框选,利用regionprops函数计算各个连通区域的面积,将所述连通区域中面积小于经验值的连通区域删除,然后将相邻两个连通区域的间距小于预定的行间最小间距的上下两个连通区域合并,对于合并后的连通区域,接着计算每个连通区域的最小外接矩形的宽高比,将宽高比小于预定阈值的连通区域删除,得到框选图像;
将所述框选图像中的矩形框按照在所述框选图像中的位置对应到所述原始图像中,对所述原始图像中的单字进行定位,获得定位图像。
优选地,在对所述原始图像进行开运算处理时,使用imopen函数和一个半径为16的圆盘型结构元素对输入的所述原始图像进行形态学开运算,去掉不包含在所述圆盘型结构元素中的点,从而实现对所述原始图像背景亮度的估计,接着根据对所述背景亮度的估计将背景图像从所述原始图像中去除,从而得到背景一致的图像,对该背景一致的图像调节对比度,获得所述增强图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安阳师范学院,未经安阳师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710004322.7/2.html,转载请声明来源钻瓜专利网。