[发明专利]易混淆字符识别模型训练方法和装置有效
申请号: | 201710427954.4 | 申请日: | 2017-06-08 |
公开(公告)号: | CN109034166B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 田凤彬 | 申请(专利权)人: | 北京君正集成电路股份有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 北京智为时代知识产权代理事务所(普通合伙) 11498 | 代理人: | 王加岭;杨静 |
地址: | 100094 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混淆 字符 识别 模型 训练 方法 装置 | ||
1.一种易混淆字符识别模型训练方法,其特征在于,包括:
获取目标易混淆字符的训练样本,将训练样本增加至训练集中;
对所述训练集中的各个训练样本进行网格划分,并获取目标网格块的网格特征;
获取所述训练集中各个训练样本的深度特征、曲度特征和直线特征;
根据所述网格特征、深度特征、曲度特征和直线特征,采用多阈值训练方式,训练得到易混淆字符识别模型;
在所述易混淆字符为0、D和Q的情况下,深度特征为从字符顶端算起,六分之一处到六分之五处,从左向右,从0到四分之一处的深度值;曲度特征为从字符顶端算起,六分之一处到六分之五处,从左向右,从0到四分之一处的曲度值;直线长度特征为从字符顶端算起,七分之一处到七分之六处,从左向右,从0到四分之一处的直线长度;
在所述易混淆字符为8和B的情况下,深度特征为从字符顶端向下算起,0到四分之一处,从左向右,从0到五分之三处的深度值;曲度特征为从字符顶端向下算起,0到四分之一处,从左向右,从0到五分之三处的曲度值;直线长度特征为从字符顶端算起,七分之一处到七分之六处,从左向右,从0到四分之一处的直线长度;
在所述易混淆字符为2和Z的情况下,深度特征为从字符顶端向下算起,0到五分之一处,从左向右,从0到五分之四处的深度值;曲度特征为从字符顶端向下算起,0到五分之一处,从左向右,从0到五分之四处的曲度值;直线长度特征为从字符顶端算起,0处到七分之一处,从左向右,从0到五分之四处的直线长度;
在所述易混淆字符为5和S的情况下,深度特征为从字符顶端向下算起,0到五分之一处,从左向右,从0到右端处的深度值;曲度特征为从字符顶端向下算起,0到五分之一处,从左向右,从0到右端处的曲度值;直线长度特征为从字符顶端算起,0处到七分之一处,从左向右,从0到右端处的直线长度和从字符顶端算起,0处到二分之一处,从左向右,从0到四分之一处的直线长度。
2.根据权利要求1所述的方法,其特征在于,在对所述训练集中的各个训练样本进行网格划分,并获取目标网格块的网格特征之前,所述方法还包括:
对所述训练集中的各个训练样本中字符,计算字符的外接矩形。
3.根据权利要求1所述的方法,其特征在于,易混淆字符包括以下一对或多对:0、D和Q,8和B,2和Z,5和S。
4.如权利要求3所述的方法,其特征在于:
在所述易混淆字符为0、D和Q的情况下,对所述训练集中的各个训练样本进行网格划分,包括,将训练样本中的字符平分为16个网格块;
在所述易混淆字符为8和B,2和Z,或者,5和S情况下,对所述训练集中的各个训练样本进行网格划分,包括,将训练样本中的字符平分为9个网格块。
5.如权利要求1所述的方法,其特征在于,在根据所述网格特征、深度特征、曲度特征和直线特征,采用多阈值训练方式,训练得到易混淆字符识别模型的过程中,对于网格特征、深度特征、曲度特征和直线特征中的每个特征设置两个阈值,在大于所述两个阈值中较大阈值的情况下,作为一类,在小于所述两个阈值中较小阈值的情况下,作为另一类,在位于所述两个阈值之间的情况下,采用下一个特征进行训练。
6.如权利要求1所述的方法,其特征在于,在根据所述网格特征、深度特征、曲度特征和直线特征,采用多阈值训练方式,训练得到易混淆字符识别模型的过程中,逐步缩小阈值进行,将识别正确率最高时的易混淆字符识别模型对应的阈值作为训练结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京君正集成电路股份有限公司,未经北京君正集成电路股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710427954.4/1.html,转载请声明来源钻瓜专利网。