[发明专利]一种自学习字符识别方法有效
申请号: | 202011538280.3 | 申请日: | 2020-12-23 |
公开(公告)号: | CN112580657B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 任玉荣;梁晓锋;王伟平;段智强;杨涛 | 申请(专利权)人: | 陕西天诚软件有限公司 |
主分类号: | G06V30/166 | 分类号: | G06V30/166;G06V30/18;G06V30/19;G06V10/764;G06V10/82;G06V10/32;G06V10/50;G06V10/75;G06N3/04;G06N3/08 |
代理公司: | 西安渭之蓝知识产权代理有限公司 61282 | 代理人: | 党桃桃 |
地址: | 710065 陕西省西安市*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自学习 字符 识别 方法 | ||
本发明属于字符识别技术领域,具体涉及一种自学习字符识别方法,包括如下步骤:(1)图像预处理;(2)训练服务器;(3)字符检测;(4)特征提取;(5)分类器处理;(6)置信度判断;(7)模型训练,结果识别。本发明方法将模板匹配和深度学习结合起来,并且将端到端的字符识别网络拆分开,独立训练字符检测和识别分类两个模型,本发明可以快速响应新增字符识别需求,并且随着数据积累识别准确率不断提升,同时本发明方法中引入位置检测功能,提高了程序的执行的准确性。
技术领域
本发明属于字符识别技术领域,具体涉及一种自学习字符识别方法。
背景技术
目前的监控系统中广泛了字符识别功能,字符识别提供了监控场景中深层语义的理解。监控场景下,一般的字符识别工作流程是通过相机拍摄物件上的标记图像信息,然后通过识别装置中的算法进行图像中的字符识别,但是可以识别的字符种类是有限的,在系统运行过程中,如果出现了新的字符就会出现错误识别的情况。
现有的字符识别方法包括模板匹配、深度学习网络识别等方法。其中模板匹配通过在已有数据中标注一个模板区域,然后在待分类的图像中检测目标字符的位置和类别,这种方法简单易用,出现新的字符的时候可以通过快速标定模板来实现新增字符的识别,但是模板匹配在复杂环境非标准字符识别中存在准确率低的问题,这是由于模板匹配算法的泛化能力较弱。
深度学习网络识别是一种端到端的方法,可以同时实现字符定位和类别分类,泛化性能较好,但是深度学习网络需要大量的数据进行训练才能使用,不能实时的响应新增的字符识别需求。并且由于端到端的深度学习网络中的目标检测和分类之间存在特征冲突问题,识别准确率仍然存在提高的空间。
发明内容
本发明的目的在于提供一种自学习字符识别方法,解决了监控管理系统中,目标物体字符识别中出现新字符识别率低的问题。
本发明的实现过程如下:
一种自学习字符识别方法,包括如下步骤:
(1)图像预处理
通过相机获取图像数据,将图像数据进行预处理;
(2)训练服务器
训练服务器包括数据集、模型训练、标签、位置检测、字符检测模型、分类模型,步骤(1)中通过相机获取图像数据同时上传数据集,当数据集的样本数量大于预设阈值时,进行模型训练,当模型训练结束后更新字符检测模型和分类模型,在使用过程中,位置检测辅助字符检测模型和分类模型;
(3)字符检测
将步骤(1)预处理之后的图像输入字符检测算法中,同时调取字符检测模型的数据从全图中检索出字符所在的位置,然后从全图中截取出字符所在的像素区域;同时将从全图中截取出字符所在的像素区域备份在更新模板库中;
(4)特征提取
将步骤(3)得到的字符所在的像素区域中每个像素区域分别送入特征提取算法中,输出每个字符对应的特征向量;
(5)分类器处理
将步骤(4)得到的每个字符对应的特征向量输入分类器算法中,同时调取分类模型的数据进行分类,输出每个字符对应的类别信息和置信度;
(6)置信度判断
逐个检查步骤(5)所检测出来的字符的置信度;
当置信度大于预先设置的阈值时,则该字符是识别正确的字符,该字符的类别就是检测出来的类别,得到识别结果;
(7)模型训练,结果识别
将步骤(6)的识别结果通过训练服务器中的模型训练传输到数据集中,其中传输的数据包括图像和字符标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西天诚软件有限公司,未经陕西天诚软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011538280.3/2.html,转载请声明来源钻瓜专利网。