[发明专利]易混淆字符识别模型训练方法和装置有效
申请号: | 201710427954.4 | 申请日: | 2017-06-08 |
公开(公告)号: | CN109034166B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 田凤彬 | 申请(专利权)人: | 北京君正集成电路股份有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 北京智为时代知识产权代理事务所(普通合伙) 11498 | 代理人: | 王加岭;杨静 |
地址: | 100094 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混淆 字符 识别 模型 训练 方法 装置 | ||
本发明提供了一种易混淆字符识别模型训练方法和装置,其中,该方法包括:获取目标易混淆字符的训练样本,将训练样本增加至训练集中;对所述训练集中的各个训练样本进行网格划分,并获取目标网格块的网格特征;获取所述训练集中各个训练样本的深度特征、曲度特征和直线特征;根据所述网格特征、深度特征、曲度特征和直线特征,采用多阈值训练方式,训练得到易混淆字符识别模型。本发明解决了现有的字符识别模型所存在的易混淆字符难以识别的技术问题,达到了准确有效识别易混淆字符的技术效果。
技术领域
本发明涉及机器识别技术领域,特别涉及一种易混淆字符识别模型训练方法和装置。
背景技术
目前,在字符识别领域已经得到了很大的发展。但是,因为有些字符较为相似,例如,在车牌中,2和Z是相似的,经常会被混淆。如果实现对易混淆字符的识别,目前尚未提出有效的解决方式。
对于这些易于混淆的字符,如果无法有效进行区分识别,往往会导致最终的识别结果出现错误。
针对该问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种易混淆字符识别模型训练方法,以使得训练得到的易混淆字符识别模型对易混淆字符的准确区分的技术效果,该方法包括:
获取目标易混淆字符的训练样本,将训练样本增加至训练集中;
对所述训练集中的各个训练样本进行网格划分,并获取目标网格块的网格特征;
获取所述训练集中各个训练样本的深度特征、曲度特征和直线特征;
根据所述网格特征、深度特征、曲度特征和直线特征,采用多阈值训练方式,训练得到易混淆字符识别模型。
在一个实施方式中,在对所述训练集中的各个训练样本进行网格划分,并获取目标网格块的网格特征之前,所述方法还包括:
对所述训练集中的各个训练样本中字符,计算字符的外接矩形。
在一个实施方式中,易混淆字符包括以下一对或多对:0、D和Q,8和B,2和Z,5和S。
在一个实施方式中,在所述易混淆字符为0、D和Q的情况下,对所述训练集中的各个训练样本进行网格划分,包括,将训练样本中的字符平分为16个网格块;
在所述易混淆字符为8和B,2和Z,或者,5和S情况下,对所述训练集中的各个训练样本进行网格划分,包括,将训练样本中的字符平分为9个网格块。
在一个实施方式中,在所述易混淆字符为0、D和Q的情况下,深度特征为从字符顶端算起,六分之一处到六分之五处,从左向右,从0到四分之一处的深度值;曲度特征为从字符顶端算起,六分之一处到六分之五处,从左向右,从0到四分之一处的曲度值;直线长度特征为从字符顶端算起,七分之一处到七分之六处,从左向右,从0到四分之一处的直线长度;
在所述易混淆字符为8和B的情况下,深度特征为从字符顶端向下算起,0到四分之一处,从左向右,从0到五分之三处的深度值;曲度特征为从字符顶端向下算起,0到四分之一处,从左向右,从0到五分之三处的曲度值;直线长度特征为从字符顶端算起,七分之一处到七分之六处,从左向右,从0到四分之一处的直线长度;
在所述易混淆字符为2和Z的情况下,深度特征为从字符顶端向下算起,0到五分之一处,从左向右,从0到五分之四处的深度值;曲度特征为从字符顶端向下算起,0到五分之一处,从左向右,从0到五分之四处的曲度值;直线长度特征为从字符顶端算起,0处到七分之一处,从左向右,从0到五分之四处的直线长度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京君正集成电路股份有限公司,未经北京君正集成电路股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710427954.4/2.html,转载请声明来源钻瓜专利网。