[发明专利]图片文字的识别方法及装置有效
申请号: | 201611060177.6 | 申请日: | 2016-11-25 |
公开(公告)号: | CN106599940B | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 李东鸽;牟晓光 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06F16/903 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 刘喆;刘铁生 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 文字 识别 方法 装置 | ||
1.一种图片文字的识别方法,其特征在于,包括:
将图片中的文字拆分为多个矩形文字框,其中,矩形文字框的个数与图片中文字的个数一致;
将所述矩形文字框内的文字编码为待匹配字符串,并将所述待匹配字符串与预设文字库中的字符串进行匹配;
根据匹配结果识别所述待匹配字符串对应的文字;
将所述矩形文字框内的文字编码为待匹配字符串包括:
获取所述矩形文字框内的文字像素及空白像素,并分别对所述文字像素及空白像素进行二进制编码;其中,所述文字像素使用二进制中的1表示,所述空白像素使用二进制中的0标识;
在分别对所述文字像素及空白像素进行二进制编码之前,所述方法包括:
计算所述矩形文字框内文字像素及空白像素的第一像素总数;
获取所述预设文字库中一个字包含的第二像素总数;
将所述第一像素总数与所述第二像素总数进行比对;
若所述第一像素总数与所述第二像素总数不相同,则根据所述第二像素总数对所述矩形文字框进行等比缩放;所述对所述矩形文字框进行等比缩放是根据所述第二像素总数对所述矩形文字框内的所述第一像素总数进行增加或缩减。
2.根据权利要求1所述的方法,其特征在于,将图片中的文字拆分为多个矩形文字框包括:
对所述图片中的文字进行解析,确定图片中文字的识别起始点;
从所述识别起始点确认各个文字的字高度及字宽度;
根据所述字高度及字宽度将图片中的文字进行拆分。
3.根据权利要求1所述的方法,其特征在于,将所述矩形文字框内的文字编码为待匹配字符串还包括:
将二进制编码后的文字像素及空白像素转换为十六进制,得到所述待匹配字符串。
4.根据权利要求3所述的方法,其特征在于,所述分别对所述文字像素及空白像素进行二进制编码包括:
若所述第一像素总数与所述第二像素总数相同,则分别对所述文字像素及空白像素进行二进制编码。
5.根据权利要求1-4中任一项所述的方法,其特征在于,在将所述矩形文字框内的文字编码为待匹配字符串之前,所述方法包括:
使用预置降噪算法对所述图片进行降噪处理。
6.根据权利要求5所述的方法,其特征在于,根据匹配结果识别所述待匹配字符串对应的文字包括:
确定所述待匹配字符串与所述预设文字库内的字符串是否完全匹配;
若确定所述待匹配字符串与所述预设文字库内的字符串完全匹配,则将所述预设文字库内的字符串对应的文字,确定为所述待匹配字符串对应的文字;
若确定所述待匹配字符串与所述预设文字库内的字符串未完全匹配,则获取所述预设文字库内与所述待匹配字符串相似度最高的字符串,并将与所述待匹配字符串相似度最高的字符串对应的文字确定为所述待匹配字符串对应的文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611060177.6/1.html,转载请声明来源钻瓜专利网。