[发明专利]一种识别图片中的字符的方法和装置有效
申请号: | 201510158353.9 | 申请日: | 2015-04-03 |
公开(公告)号: | CN104766077B | 公开(公告)日: | 2017-04-12 |
发明(设计)人: | 薛永刚;贾文杰;项碧波 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京市隆安律师事务所11323 | 代理人: | 权鲜枝,何立春 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 图片 中的 字符 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,具体涉及一种识别图片中的字符的方法和装置。
背景技术
在信息技术及终端技术日益普及的今天,如何将字符方便、快捷地输入到终端中已经成为影响人机接口效率的一个重要难题。现有技术中,大部分用户仍然依赖于传统的键盘输入或手写输入来完成字符的输入,能够满足用户基本输入需求。但是,传统的输入方式也为用户带来了很多不便,例如,当用户对一个图片中所包含的字符有疑问,需要进行搜索时,需要将图片中所包含的字符依次手动输入到搜索栏中;或者,当用户需要保存一个图片中的电话号码时,也需要将图片中所包含的电话号码记在其他地方,再依次手动输入到电话薄中。可见,由于终端无法识别图片中所包含的字符,导致用户对图片中所包含的字符的处理十分费时费力,不符合用户的需求。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种识别图片中的字符的方法和装置。
依据本发明的一个方面,提供了一种识别图片中的字符的方法,该方法包括:
识别图片所包含的字符占位,获取每个字符占位对应的候选字符集合以及每个候选字符对应的概率参数;
按照所述图片所包含的各字符占位的顺序,依次从每个字符占位对应的候选字符集合中选取一个候选字符得到一个候选字符组合;进行多次选取,每次选取到不同的字符组合,得到多个候选字符组合;
计算所得到的每个候选字符组合的概率,
将概率最高的候选字符组合作为对所述图片的字符识别结果。
可选地,所述计算所得到的每个候选字符组合的概率为:
基于n元语法模型,计算所得到的每个候选字符组合的概率。
可选地,所述基于n元语法模型,计算所得到的每个候选字符组合的概率包括:
对于一个候选字符组合中的每个候选字符,根据各候选字符的概率参数,计算该候选字符在其前n-1个候选字符已经确定的条件下出现的条件概率;
计算该候选字符组合中各候选字符的条件概率的乘积,作为该候选字符组合的概率。
可选地,利用光学字符识别技术识别图片所包含的字符占位,获取每个字符占位对应的候选字符集合以及每个候选字符对应的概率参数。
依据本发明的又一个方面,提供了一种识别图片中的字符的装置,该装置包括:
获取单元,适于识别图片所包含的字符占位,获取每个字符占位对应的候选字符集合以及每个候选字符对应的概率参数;
预处理单元,适于按照所述图片所包含的各字符占位的顺序,依次从每个字符占位对应的候选字符集合中选取一个候选字符得到一个候选字符组合;进行多次选取,每次选取到不同的字符组合,得到多个候选字符组合;
识别单元,适于计算所得到的每个候选字符组合的概率,将概率最高的候选字符组合作为对所述图片的字符识别结果。
可选地,所述识别单元,适于基于n元语法模型,计算所得到的每个候选字符组合的概率。
可选地,所述识别单元,适于对于一个候选字符组合中的每个候选字符,根据各候选字符的概率参数,计算该候选字符在其前n-1个候选字符已经确定的条件下出现的条件概率;再计算该候选字符组合中各候选字符的条件概率的乘积,作为该候选字符组合的概率。
可选地,所述获取单元,适于利用光学字符识别技术识别图片所包含的字符占位,获取每个字符占位对应的候选字符集合以及每个候选字符对应的概率参数。
由上述可知,本发明这种通过获取图片所包含的字符占位对应的候选字符集合以及每个候选字符对应的概率参数,对图片中可能包含的所有候选字符组合的概率进行计算,将概率最高的候选字符组合作为对图片的字符识别结果的技术方案,将图像信息转化为可以供计算机识别和处理的文本信息,大大提高了用户对图片中的字符信息进行资料存储、检索、加工的效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种识别图片中的字符的方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510158353.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:智能卡发卡方法及系统
- 下一篇:基于多视角学习的鲁棒性前景检测方法