[发明专利]一种基于模板匹配和BP神经网络的东巴文识别方法有效

专利信息
申请号: 202010101030.7 申请日: 2020-02-19
公开(公告)号: CN111325270B 公开(公告)日: 2022-03-25
发明(设计)人: 庄建军;夏一飞;魏世桓;沈祎辰;赵一鸣;王昀牧;申彤;黎文斯;张鑫;杨鸿荣;杨继琼;张志俭 申请(专利权)人: 南京大学
主分类号: G06V30/19 分类号: G06V30/19;G06V30/244;G06V30/148;G06V30/168;G06V30/164;G06V30/30;G06K9/62;G06N3/08
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 陈建和
地址: 210093 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 模板 匹配 bp 神经网络 东巴文 识别 方法
【权利要求书】:

1.基于模板匹配和BP神经网络的东巴文识别方法,其特征是,由如下步骤构成,1)图片预处理、2)特征提取、3)模板匹配、4)神经网络处理四个步骤;

步骤1)中,图片预处理包括二值化、图片去噪和细化处理;图片指直接通过拍照或扫描得到的东巴文彩色图片;

1-1)将图片灰度化,用最大类间方差法确定灰度阈值,根据灰度阈值将图片二值化;二值化后的图片被称为二值图片,二值图片由像素点“0”、即图片中的空白像素和像素点“1”、即构成笔划的黑色像素构成;“像素点”未特殊说明时即指像素点“1”;

1-2)对图片做闭操作处理,删除面积小于面积阈值的连通区域;闭操作:第一步,遍历二值图片的全部像素,将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”,将全部图片边缘像素点修改为像素点“1”;第二步,重新遍历图片并标记图片边缘像素点,将全部图片边缘像素点修改为像素点“0”;

删除面积小于阈值的连通区域:连通区域指二值图片中以8连通寻找位置相邻的像素点“1”组成的图片区域,连通区域的面积等于像素点“1”的个数;遍历二值图片的全部像素,标记每一个连通区域的位置和面积;将每一个面积小于面积阈值的连通区域的所有像素点“1”修改为像素点“0”;

1-3)用罗森菲尔德细化算法对图片做细化处理,得到东巴文文字骨架图片;

细化算法:遍历二值图片的全部像素,将像素点“1”和像素点“0”的边界像素点标记为“图片边缘像素点”;若将某一个边缘像素点“1”修改为像素点“0”的操作不会增加以8连通寻找连通区域的个数,则执行此操作;对全部图片边缘像素点执行以上操作称为一次“细化”,反复执行“细化”直到没有能够修改的像素点则停止“细化”;

2)特征提取包括归一化和笔划特征提取;

2-1)归一化的方法,计算图片的重心位置、横向标准差和纵向标准差,对图片进行平移和缩放,使得图片重心与图片中心重合,横向标准差和纵向标准差为固定值;

2-2)笔划特征提取的方法,笔划特征包括笔划的连通块位置特征、笔划的封闭块位置特征、笔划的端点位置特征、笔划的交点位置特征和笔划的连线位置特征;

步骤2-2)中,笔划的连通块位置特征的提取:确定笔划的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为连通块位置特征;

封闭块位置特征的提取:对图片做非运算,再确定图片中以4连通寻找每一个连通区域的重心位置,将重心位置的坐标作为封闭块位置特征;

非运算:指将像素点“1”修改为像素点“0”,将像素点“0”修改为像素点“1”;

端点位置特征的提取:计算图片中每一个像素点的以8邻域寻找相邻像素点的个数,仅保留相邻像素点的个数为0或1的像素点;确定这些像素点构成的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为端点位置特征;

交点位置特征的提取:计算图片中每一个像素点的以8邻域寻找相邻像素点的个数,仅保留相邻像素点的个数大于2的像素点;确定这些像素点构成的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为交点位置特征;

连线位置特征的提取:计算图片中以8邻域寻找每一个像素点的相邻像素点的个数,仅保留相邻像素点的个数等于2的像素点;确定这些像素点构成的图片中以8连通寻找每一个连通区域的重心位置,将重心位置的坐标作为连线位置特征;

3)模板匹配的方法

利用改进后的豪斯多夫距离计算样本图片的笔划特征与模板图片的笔划特征之间的距离:对于每一种笔划特征,分别可以得到样本图片的位置特征对应的坐标集合为A={(x1,y1),(x2,y2),...,(xn,yn)},而欲匹配的模板图片的位置特征对应的坐标集合为B={(x′1,y′1),(x′2,y′2),...,(x′m,y′m)};

根据改进后的豪斯多夫距离,样本图片的笔划特征与模板图片的笔划特征之间的距离为:其中a,b分别是A,B中的坐标点;

4)、神经网络处理的方法

将样本图片与全部东巴文模板图片做模板匹配的距离按固定顺序排列为一个列向量;对每一种笔划特征进行该操作,共得到5个维度相同的列向量,记为{X1,X2,X3,X4,X5},即特征向量;将特征向量送入BP神经网络进行训练;

神经网络设置了两层隐藏层;输出层使用归一化指数函数进行分类操作;神经网络执行前向传播时,首先对同一个列向量中的各个元素分配不同的权值,然后进入全连接层并输出;神经网络执行反向传播时,更新参数矩阵的权值;利用梯度下降算法,选择合适的学习率,利用一定量的东巴文图片样本进行训练;当损失函数收敛至较小值时,保存神经网络的权值矩阵;权值矩阵即神经网络保存的训练数据;当神经网络需要识别新的图片样本时,需要读取并调用该权值矩阵从而实现准确的识别。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010101030.7/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top