[发明专利]基于CNN结构神经网络的水书文字识别方法在审
申请号: | 201910217488.6 | 申请日: | 2019-03-21 |
公开(公告)号: | CN110348280A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 丁琼 | 申请(专利权)人: | 贵州工业职业技术学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 贵阳中新专利商标事务所 52100 | 代理人: | 商小川 |
地址: | 551400 贵州省*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 文字识别 样本 神经网络模型 文字识别技术 算法实现 特征提取 准确率 采集 分类 检测 | ||
本发明公开了一种基于CNN结构神经网络的水书文字识别方法,它包括步骤1、采集水书文字样本;步骤2、采用基于CNN结构神经网络模型对水书文字样本进行特征提取和分类;步骤3、采用YOLO算法实现水书字符的定位与检测;解决了现有技术中通过常规文字识别技术识别水书文字存在准确率低下等问题。
技术领域
本发明属于文字识别技术,尤其涉及一种基于CNN结构神经网络的水书文字识别方法。
背景技术:
在计算机视觉领域,物体识别和定位一直是一个重要研究方向,对水书文字的识别也正是属于这一范畴的问题,由于水书文字属于象形文字,为非标准化文字,在收集的水书样本中,几乎都是手写的水书资料,同一个字不同的人写出来差别可能很大,还有很多水书文字都是和其他文字(例如:汉字)混编在一起,从一个混编文献中准确识别出水书文字,而不误识别其它文字或图案,这对字符分割、定位与检测,及字符特征提取与分类算法都提出了很高的要求;另外,由于水书文字与自然图片相比较在特征上有极大的不同,而通常神经网络都是在ImageNet等通用的图像分类数据集上进行的预训练,普通的神经网络很难泛化这些特征上的区别;因此采用现有技术的文字识别方法识别水书文字存在准确率低下等问题。
发明内容:
本发明要解决的技术问题:提供一种基于CNN结构神经网络的水书文字识别方法,以解决现有技术中通过常规文字识别技术识别水书文字存在准确率低下等问题。
本发明的技术方案:
一种基于CNN结构神经网络的水书文字识别方法,它包括:
步骤1、采集水书文字样本;
步骤2、采用基于CNN结构神经网络模型对水书文字样本进行特征提取和分类;
步骤3、采用YOLO算法实现水书字符的定位与检测。
步骤3所述采用YOLO算法实现水书字符的定位与检测的方法包括:
步骤3.1、将输入图片划分为S*S个格子;
步骤3.2、每个格子预测出B个方框和它的置信度;
步骤3.3、每个方框包括五个预测值:x,y,w,h,和置信度,x,y代表方框中心相对于格子的坐标,w,h代表方框宽度和高度,置信度代表预测方框和所有标注方框的IOU;
步骤3.4、每个格子还要预测出C个条件概率Pr(Class i | Object),条件是基于格子包含物体的情况下,对于每个格子预测一组条件概率(C个),而不管B的数量;
步骤3.5、在检测中,最后将类别的条件概率和每个方框的置信度相乘:
Pr(Classi|Object) ∗Pr(Object) ∗ IOU = Pr(Classi) ∗ IOU
得出每个方框对于每个类别的置信度,这个分数即包含了类别准确性的概率也包含了预测框对物体的符合程度。
本发明的有益效果:
本发明采用的卷积神经网络(CNN)是一种特殊的深层的神经网络模型,它是将BP和深度学习网络相结合而产生的新型BP。卷积神经网络是为了识别二维形状而设汁的多层感知器,具有局部感受,层次结构、特征提取和分类过程结合的全局训练的特点。这种网络结构可对平移、旋转、比例缩放、倾斜或者其他形式的变形具有高度不变性;CNN网络利用了图像的空间信息,增强了图像中的特征,同时,由于共用权值,大大减少了参数量,使得CNN结构在训练时更能减少过拟合现象,提高了模型的泛化能力;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州工业职业技术学院,未经贵州工业职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910217488.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:物体识别处理装置和方法、以及物体拣选装置和方法
- 下一篇:警报装置