[发明专利]OCR识别结果的纠正方法和装置在审
申请号: | 201710245168.2 | 申请日: | 2017-04-14 |
公开(公告)号: | CN107220639A | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 李健;徐亮;伍更新;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ocr 识别 结果 纠正 方法 装置 | ||
1.一种OCR识别结果的纠正方法,其特征在于,包括:
采用OCR技术对纸质文档中目标区域内的待识别字符进行识别,获取初始识别结果字符串str;
根据所述待识别字符在所述纸质文档中的属性以及所述属性的属性值的预先设定字符范围,构造符合所述预先设定字符范围的多个候选字符串stri以构成候选字符串集合;
依次计算所述初始识别结果字符串str与所述候选字符串集合中的每个候选字符串stri的最小编辑距离dmin;
利用所述最小编辑距离dmin,按照以下相似度公式计算所述初始识别结果字符串str与每个候选字符串stri的相似度Si,相似度Si=1-dmin/max(p,q),其中,p为所述初始识别结果字符串str的字符串长度,q为所述候选字符串集合中每个候选字符串stri的字符串长度,其中,不同字符串长度的候选字符串的q值不同;
将最大的相似度Smax所对应的候选字符串strj输出为对所述初始识别结果字符串str的纠正结果。
2.根据权利要求1所述的方法,其特征在于,所述依次计算所述初始识别结果字符串str与所述候选字符串集合中的每个候选字符串stri的最小编辑距离dmin的步骤,包括:
获取所述初始识别结果字符串str的字符串长度p;
获取当前计算的候选字符串stri的字符串长度q;
若p=0且q≠0,则所述初始识别结果字符串str与当前计算的候选字符串stri的最小编辑距离dmin=q;
若q=0且p≠0,则所述初始识别结果字符串str与当前计算的候选字符串stri的最小编辑距离dmin=p;
若p≠0且q≠0,则构造矩阵D[p+1][q+1],其中,所述矩阵D[p+1][q+1]的第0行从左至右的元素的赋值以及第0列从上至下的元素的赋值均从0开始依次递增,每次加1,使得元素d[0][q]=q,元素d[p][0]=p;
扫描所述初始识别结果字符串str中的每个字符str[j]和当前计算的候选字符串stri中的每个字符stri[i]分别进行比较,若stri[i]=str[j],则参数temp=0,否则temp=1,同时,针对矩阵D[p+1][q+1]中的元素d[i][j]进行如下赋值:
d[i][j]=﹛(d[i-1][j])+1,(d[i][j-1])+1,(d[i-1][j-1]+temp)﹜min;
将矩阵D[p+1][q+1]中的元素d[p+1][q+1]的赋值确定为所述初始识别结果的字符串str与当前计算的候选字符串stri的最小编辑距离dmin。
3.一种OCR识别结果的纠正装置,其特征在于,包括:
OCR识别模块,用于采用OCR技术对纸质文档中目标区域内的待识别字符进行识别,获取初始识别结果字符串str;
候选字符串构造模块,用于根据所述待识别字符在所述纸质文档中的属性以及所述属性的属性值的预先设定字符范围,构造符合所述预先设定字符范围的多个候选字符串stri以构成候选字符串集合;
距离计算模块,用于依次计算所述初始识别结果字符串str与所述候选字符串集合中的每个候选字符串stri的最小编辑距离dmin;
相似度计算模块,用于利用所述最小编辑距离dmin,按照以下相似度公式计算所述初始识别结果字符串str与每个候选字符串stri的相似度Si,相似度Si=1-dmin/max(p,q),其中,p为所述初始识别结果字符串str的字符串长度,q为所述候选字符串集合中每个候选字符串stri的字符串长度,其中,不同字符串长度的候选字符串的q值不同;
结果纠正输出模块,用于将最大的相似度Smax所对应的候选字符串strj输出为对所述初始识别结果字符串str的纠正结果。
4.根据权利要求3所述的装置,其特征在于,所述距离计算模块包括:
第一获取子模块,用于获取所述初始识别结果字符串str的字符串长度p;
第二获取子模块,用于获取当前计算的候选字符串stri的字符串长度q;
第一计算子模块,用于若p=0且q≠0,则所述初始识别结果字符串str与当前计算的候选字符串stri的最小编辑距离dmin=q;
第二计算子模块,用于若q=0且p≠0,则所述初始识别结果字符串str与当前计算的候选字符串stri的最小编辑距离dmin=p;
矩阵构造子模块,用于若p≠0且q≠0,则构造矩阵D[p+1][q+1],其中,所述矩阵D[p+1][q+1]的第0行从左至右的元素的赋值以及第0列从上至下的元素的赋值均从0开始依次递增,每次加1,使得元素d[0][q]=q,元素d[p][0]=p;
比较赋值子模块,用于扫描所述初始识别结果字符串str中的每个字符str[j]和当前计算的候选字符串stri中的每个字符stri[i]分别进行比较,若stri[i]=str[j],则参数temp=0,否则temp=1,同时,针对矩阵D[p+1][q+1]中的元素d[i][j]进行如下赋值:
d[i][j]=﹛(d[i-1][j])+1,(d[i][j-1])+1,(d[i-1][j-1]+temp)﹜min;
确定子模块,用于将矩阵D[p+1][q+1]中的元素d[p+1][q+1]的赋值确定为所述初始识别结果的字符串str与当前计算的候选字符串stri的最小编辑距离dmin。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710245168.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种盾构机隧道异型管片吊运装置
- 下一篇:一种铝蜂窝板的制备方法