[发明专利]语境化字符识别系统在审
申请号: | 202011515538.8 | 申请日: | 2020-12-21 |
公开(公告)号: | CN113076939A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | R.K.古普塔;J.赫内;A.R.卡蒂 | 申请(专利权)人: | SAP欧洲公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 德国瓦*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语境 字符 识别 系统 | ||
1.一种用于提供语境化字符识别系统的方法,包括:
确定图像的多个预测单词,其中所述多个预测单词是基于图像的光学分析生成的;
为多个预测单词中的每一个识别准确性度量;
基于可替换单词的准确性度量低于阈值,从多个可预测单词中识别可替换单词;
识别与可替换单词相关联的多个候选单词;
基于相对于多个预测单词中的一个或多个的每个候选单词的语境分析,为多个候选单词中的每一个计算概率;
选择多个候选单词中的具有最高概率的一个,其中选择的候选单词的概率超过准确性度量和阈值;以及
输出包括替换可替换单词的具有最高概率的选择的候选单词的多个预测单词。
2.根据权利要求1所述的方法,还包括:
接收图像;
识别图像中的多个字符;以及
将多个字符组合成多个预测单词。
3.根据权利要求1所述的方法,其中基于语境分析计算准确性度量,在语境分析中,出现在多个预测单词中的选择的一个之前的一个或多个预测单词的短语与出现在多个预测单词中的选择的一个之后的一个或多个预测单词的短语进行比较。
4.根据权利要求1所述的方法,其中,所述识别多个候选单词包括:
确定可替换单词包括多个字符;
为多个字符中的至少一个识别替代字符;以及
将包括替代字符的可替换单词识别为是多个候选单词中的一个。
5.根据权利要求4所述的方法,其中所述识别替代字符基于多个字符中的至少一个的光学分析。
6.根据权利要求1所述的方法,其中所述识别多个候选单词包括:
使用具有多个阈值的非最大抑制来生成多个候选单词中的一个。
7.根据权利要求1所述的方法,其中所述识别多个候选单词包括:
跨用于可替换单词中的至少一个字符的多个像素,针对每一个像素识别字符预测,其中可替换单词包括多个字符;
确定跨多个像素存在至少两个不同的预测,包括第一预测和第二预测;以及
识别包括第一预测和多个字符的多个候选单词中的第一个。
8.根据权利要求7所述的方法,还包括:
识别包括第二预测和多个字符的多个候选单词中的第二个。
9.一种用于提供语境化字符识别系统的系统,包括:
存储器;以及
至少一个处理器,耦合到存储器并被配置为执行操作,所述操作包括:
确定图像的多个预测单词,其中所述多个预测单词是基于图像的光学分析生成的;
为多个预测单词中的每一个识别准确性度量;
基于可替换单词的准确性度量低于阈值,从多个可预测单词中识别可替换单词;
识别与可替换单词相关联的多个候选单词;
基于相对于多个预测单词中的一个或多个的每个候选单词的语境分析,为多个候选单词中的每一个计算概率;
选择多个候选单词中的具有最高概率的一个,其中选择的候选单词的概率超过准确性度量和阈值;以及
输出包括替换可替换单词的具有最高概率的选择的候选单词的多个预测单词。
10.根据权利要求9所述的系统,其中所述操作还包括:
接收图像;
识别图像中的多个字符;以及
将多个字符组合成多个预测单词。
11.根据权利要求9所述的系统,其中基于语境分析计算准确性度量,在语境分析中,出现在多个预测单词中的选择的一个之前的一个或多个预测单词的短语与出现在多个预测单词中的选择的一个之后的一个或多个预测单词的短语进行比较。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于SAP欧洲公司,未经SAP欧洲公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011515538.8/1.html,转载请声明来源钻瓜专利网。