[发明专利]一种基于模板匹配和BP神经网络的东巴文识别方法有效
申请号: | 202010101030.7 | 申请日: | 2020-02-19 |
公开(公告)号: | CN111325270B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 庄建军;夏一飞;魏世桓;沈祎辰;赵一鸣;王昀牧;申彤;黎文斯;张鑫;杨鸿荣;杨继琼;张志俭 | 申请(专利权)人: | 南京大学 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/244;G06V30/148;G06V30/168;G06V30/164;G06V30/30;G06K9/62;G06N3/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模板 匹配 bp 神经网络 东巴文 识别 方法 | ||
基于模板匹配和BP神经网络的东巴文识别方法,由如下步骤构成,1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤;步骤1)中,图片预处理包括二值化、图片去噪和细化处理;图片指直接通过拍照或扫描得到的东巴文彩色图片;步骤2)特征提取包括归一化和笔划特征提取;端点位置特征的提取:计算图片中每一个像素点的以8邻域寻找相邻像素点的个数,仅保留相邻像素点的个数为0或1的像素点;确定这些像素点构成的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为端点位置特征;步骤3)模板匹配的方法,利用改进后的豪斯多夫距离计算样本图片的笔划特征与模板图片的笔划特征之间的距离。
技术领域
本发明涉及一种古文字的识别方法,尤其是东巴文的识别方法。
背景技术:
东巴文是一种文字形态原始的象形文字。由于学习和使用东巴文的人群数量正在减少,为满足研究和保护东巴文的要求,需要实现计算机对东巴文的自动识别。
现有技术方案一般如下或类似的步骤:
步骤1、将欲识别图片灰度化,并平滑去噪。
步骤2、用投影法和特征点法进行特征提取。
步骤3、分别用模板匹配法或高阶神经网络进行识别。现有技术需要大量已识别的东巴文图片样本。由于模板匹配法是基于单一模板进行匹配,在图片噪声的干扰下识别准确率低;由于利用神经网络进行训练需要大量已识别的图片样本,而已识别的东巴文图片数量较少,易出现欠拟合的现象。
发明内容
发明目的:本发明所要解决的技术问题是:准确识别东巴文图片样本内容。通过提出改进技术手段来准确识别包含东巴文文字的图片中的东巴文文字内容。利用东巴文模板和少量样本,准确识别包含东巴文文字的图片的东巴文文字内容,为东巴文研究者提供高效的识别工具。
本发明的技术方案是,基于模板匹配和BP神经网络的东巴文识别方法,其特征是,由如下步骤构成,1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤;
步骤1)中,图片预处理包括二值化、图片去噪和细化处理;图片指直接通过拍照或扫描得到的东巴文彩色图片。
1-1)将图片灰度化,用最大类间方差法确定灰度阈值,根据灰度阈值将图片二值化;二值化后的图片被称为二值图片,二值图片由像素点“0”(即图片中的空白像素)和像素点“1”(即构成笔划的黑色像素)构成。下文“像素点”未特殊说明时即指像素点“1”。
1-2)对图片做闭操作处理,删除面积小于面积阈值(阈值可根据情况设定)的连通区域;闭操作:第一步,遍历二值图片的全部像素,将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”,将全部图片边缘像素点修改为像素点“1”。第二步,重新遍历图片并标记图片边缘像素点,将全部图片边缘像素点修改为为像素点“0”。
删除面积小于阈值的连通区域:连通区域指二值图片中位置相邻(以8连通寻找)的像素点“1”组成的图片区域,连通区域的面积等于像素点“1”的个数。遍历二值图片的全部像素,标记每一个连通区域的位置和面积。将每一个面积小于面积阈值(8-16个像素点)的连通区域的所有像素点“1”修改为像素点“0”。
1-3)用罗森菲尔德细化算法对图片做细化处理,得到东巴文文字骨架图片。
细化算法:遍历二值图片的全部像素,将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”。若将某一个边缘像素点“1”修改为为像素点“0”的操作不会增加连通区域的个数(以8连通寻找),则执行此操作。对全部图片边缘像素点执行以上操作称为一次“细化”,反复执行“细化”直到没有能够修改的像素点则停止“细化”。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010101030.7/2.html,转载请声明来源钻瓜专利网。