[发明专利]字符识别方法及装置在审

专利信息
申请号: 201511001283.2 申请日: 2015-12-28
公开(公告)号: CN105631450A 公开(公告)日: 2016-06-01
发明(设计)人: 龙飞;王百超;侯文迪 申请(专利权)人: 小米科技有限责任公司
主分类号: G06K9/34 分类号: G06K9/34
代理公司: 北京尚伦律师事务所 11477 代理人: 代治国
地址: 100085 北京市海淀区清*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 字符 识别 方法 装置
【说明书】:

技术领域

本公开涉及字符识别技术领域,尤其涉及字符识别方法及装置。

背景技术

目前,字符识别技术被应用在了众多领域。在进行诸如身份证信息提取 等任务时,出于种种原因字符切割地未必准确,会出现一些错误,常见的错 是会将前一个字的偏旁被切到了下一个字中,例如“川”字,在切割时,很 容易把最右边的竖切到后面的字符中,从而导致字符识别结果的准确度较低 。

发明内容

本公开实施例提供了字符识别方法及装置。所述技术方案如下:

根据本公开实施例的第一方面,提供一种字符识别方法,包括:

对字符图像进行字符识别,获得字符识别结果;

从所述字符识别结果中,确定出置信度小于或等于第一预设阈值的目标 字符;

对所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像 块,每个所述字符图像块中包括一个单元字符;

根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别。

在一个实施例中,所述对所述目标字符所在的字符图像区域进行切割, 包括:

获取所述目标字符的字符排列方向;

将所述字符排列方向作为切割方向,对所述目标字符所在的字符图像区 域进行切割。

在一个实施例中,所述根据所述至少两个字符图像块对所述字符图像区 域重新进行字符识别,包括:

分别对所述至少两个字符图像块进行字符识别,获得所述至少两个字符 图像块各自所包括的单元字符;

按照所述至少两个字符图像块在所述字符图像区域中的排列顺序,对所 述至少两个字符图像块各自所包括的单元字符进行排列;

对排列后的所述单元字符进行组合处理,获得至少两组字符组合;

从所述至少两组字符组合中,确定出置信度满足预设条件的字符组合;

将所述置信度满足预设条件的字符组合确定为所述字符图像区域的字符 识别结果。

在一个实施例中,所述置信度满足预设条件的字符组合,包括以下第一 种字符组合或者第二种字符组合:

第一种字符组合包括:组合内每个字符各自的置信度均大于第二预设阈 值的字符组合;其中,所述第二预设阈值大于或等于第一预设阈值;

第二种字符组合包括:在所述至少两组字符组合中,组合内所有字符各 自的置信度之和最高的字符组合。

在一个实施例中,当所述目标字符包括汉字时,所述单元字符包括偏旁 部首、或者独体字。

根据本公开实施例的第二方面,提供一种字符识别装置,包括:

第一识别模块,用于对字符图像进行字符识别,获得字符识别结果;

确定模块,用于从所述第一识别模块获得的所述字符识别结果中,确定 出置信度小于或等于第一预设阈值的目标字符;

切割模块,用于对所述确定模块确定出的所述目标字符所在的字符图像 区域进行切割,获得至少两个字符图像块,每个所述字符图像块中包括一个 单元字符;

第二识别模块,用于根据所述切割模块获得的所述至少两个字符图像块 对所述字符图像区域重新进行字符识别。

在一个实施例中,所述切割模块包括:

获取子模块,用于获取所述目标字符的字符排列方向;

切割子模块,用于将所述获取子模块获取到的所述字符排列方向作为切 割方向,对所述目标字符所在的字符图像区域进行切割。

在一个实施例中,所述第二识别模块,包括:

识别子模块,用于分别对所述至少两个字符图像块进行字符识别,获得 所述至少两个字符图像块各自所包括的单元字符;

排序子模块,用于按照所述至少两个字符图像块在所述字符图像区域中 的排列顺序,对所述至少两个字符图像块各自所包括的单元字符进行排列;

组合子模块,用于对所述排列后的所述单元字符进行组合处理,获得至 少两组字符组合;

第一确定子模块,用于从所述至少两组字符组合中,确定出置信度满足 预设条件的字符组合;

第二确定子模块,用于将所述置信度满足预设条件的字符组合确定为所 述字符图像区域的字符识别结果。

在一个实施例中,所述置信度满足预设条件的字符组合,包括以下第一 种字符组合或者第二种字符组合:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201511001283.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top