[发明专利]文字图像中字符识别方法和识别装置有效
申请号: | 201210477638.5 | 申请日: | 2012-11-21 |
公开(公告)号: | CN102982330A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 郝双 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 黄启行;方晓明 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 图像 字符 识别 方法 装置 | ||
1.一种文字图像中字符识别方法,包括:
对所述文字图像中切割出的字符,以设定单位进行划分;并对每个设定单位内的字符进行识别:
对所述设定单位内的每个字符进行特征提取和特征匹配后,确定每个字符的候选字;
针对所述设定单位内的每个字符,确定该字符的每个候选字的相似度、以及该字符的每个候选字与该字符相邻的字符的候选字之间的转移概率;
根据确定出的相似度和转移概率,确定出所述设定单位内的字符的识别结果。
2.如权利要求1所述的方法,其特征在于,所述识别结果还根据所述设定单位内的每个字符的每个候选字的出现概率确定。
3.如权利要求1所述的方法,其特征在于,所述根据确定出的相似度和转移概率,确定出所述设定单位内的字符的识别结果具体包括:
确定该设定单位内的第1个字符的候选字的维特比概率为该候选字的相似度;
从该设定单位内的第2个字符起,对于当前字符的每个候选字,根据该候选字的相似度、以及该候选字与该当前字符相邻的字符中的在前字符的候选字之间的转移概率,确定出所述当前字符的每个候选字与所述在前字符的各候选字之间的维特比概率;
在确定出当前候选字与各在前候选字之间的维特比概率后,比较各维特比概率,从中选择最大的维特比概率作为当前候选字的维特比概率;其中,所述当前候选字为所述当前字符的候选字之一,所述在前候选字为所述在前字符的候选字之一;
以所述当前候选字作为当前节点,选择与该当前候选字之间的维特比概率最大的在前候选字作为与该当前候选字相邻的在前节点;
确定候选路径;其中,所述候选路径中的每个节点为分别针对所述设定单位内的每个字符选择出的候选字,同一候选路径中的相邻节点是根据每个候选字的在前节点确定的;
比较各候选路径的最后节点的维特比概率,以最后节点的维特比概率最大的候选路径作为所述识别结果。
4.如权利要求3所述的方法,其特征在于,所述根据该候选字的相似度、以及该候选字与该当前字符相邻的字符中的在前字符的候选字之间的转移概率,确定出所述当前字符的每个候选字与所述在前字符的各候选字之间的维特比概率,具体根据如下公式5或4:
Pv=P2×R×Pv′ (公式5)
logPv=b×logP2+c×logR+d×logPv′(公式4)
其中,Pv为所述当前候选字与所述在前候选字之间的维特比概率;P1为所述当前候选字的出现概率,P2为所述在前候选字与所述当前候选字之间的转移概率;R为所述当前候选字的相似度;Pv′为所述在前候选字的维特比概率;logPv、logP1、logP2、logR、logPv′分别为对Pv、P1、P2、R、Pv′取对数后得到的值;b、c、d分别为设置的权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210477638.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种非时效中强度全铝合金导线
- 下一篇:烧录治具
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序