[发明专利]OCR识别结果位置校正方法及相关设备在审

专利信息
申请号: 202110889386.6 申请日: 2021-08-04
公开(公告)号: CN113610093A 公开(公告)日: 2021-11-05
发明(设计)人: 王伟;黄勇其;于翠翠;张黔 申请(专利权)人: 润联软件系统(深圳)有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/34;G06K9/00
代理公司: 深圳市世联合知识产权代理有限公司 44385 代理人: 汪琳琳
地址: 518000 广东省深圳市福田区梅林街*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: ocr 识别 结果 位置 校正 方法 相关 设备
【权利要求书】:

1.一种OCR识别结果位置校正方法,其特征在于,所述方法包括:

通过基于OCR技术的识别模型对识别文档进行实体识别,得到识别结果,其中,所述识别结果中包括至少一个文档实体;

构建各所述文档实体的方位关系空间;

基于所述方位关系空间,提取各所述文档实体的实体表征向量以及方位关系表征向量;

将所述实体表征向量和所述方位关系表征向量输入到训练后的方位校正模型中,得到各方位关系空间中文档实体的方位标签序列,并基于所述方位标签序列对各所述文档实体进行位置校正,得到校正结果。

2.根据权利要求1所述的方法,其特征在于,所述构建各所述文档实体的方位关系空间,包括:

获取所述识别文档的标准间距;

基于所述标准间距,以各所述文档实体为中心实体,确定所述中心实体所在中心区域的邻近实体区域,得到各文档实体对应的方位关系空间,其中,每个所述邻近实体区域中包括至多一个文档实体或至多一个虚拟实体,作为所述方位关系空间的空间实体。

3.根据权利要求2所述的方法,其特征在于,所述获取所述识别文档的标准间距,包括:

计算所述识别文档的平均行距;

将所述平均行距作为所述标准间距。

4.根据权利要求3所述的方法,其特征在于,所述基于所述平均间距,以各所述文档实体为中心实体,确定所述中心实体所在中心区域的邻近实体区域,得到各文档实体对应的方位关系空间,包括:

以所述平均行距作为各中心实体所在中心区域的区域边长;

构建以各中心实体所在中心区域为中心的九宫格区域,作为方位关系空间,其中,每个九宫格区域包括一个中心区域以及与所述中心区域的8个邻近实体区域。

5.根据权利要求4所述的方法,其特征在于,所述提取各所述文档实体的实体表征向量以及方位关系表征向量,包括:

确定各方位关系空间上空间区域中空间实体的的实体类型;

根据所述实体类型调用对应的特征提取算法,以提取得到所述实体表征向量和方位关系表征向量。

6.根据权利要求5所述的方法,其特征在于,所述确定各方位关系空间中空间实体的实体类型,根据所述实体类型调用对应的特征提取算法,以提取得到实体表征向量和方位关系表征向量,包括:

识别各空间实体所在的区域是否存在连通域;

若是,确定所述文档实体的实体类型为文档实体,并调用卷积神经网络提取所述文档实体的实体表征向量和方位关系表征向量;

若否,确定所述文档实体的实体类型为虚拟实体,并调用词袋模型提取所述实体表征向量和方位关系表征向量。

7.根据权利要求2所述的方法,其特征在于,所述方位标签序列包括各所述邻近实体区域相对于对应的中心区域中的中心实体的方位,所述将所述实体表征向量和所述方位关系表征向量输入到训练后的方位校正模型中,得到各方位关系空间中文档实体的方位标签序列,并基于所述方位标签序列对各所述文档实体进行位置校正,得到校正结果,包括:

确定不同方位关系空间的空间关系;

获取不同方位关系空间中不同临近实体区域相对于对应的中心区域中中心实体的方位;

根据所述空间关系和所述方位,对各所述文档实体进行位置校正。

8.一种OCR识别结果位置校正装置,其特征在于,包括:

识别模块,用于通过基于OCR技术的识别模型对识别文档进行实体识别,得到识别结果,其中,所述识别结果中包括至少一个文档实体;

构建模块,用于构建各所述文档实体的方位关系空间;

提取模块,用于基于所述方位关系空间,提取各所述文档实体的实体表征向量以及方位关系表征向量;

校正模块,用于将所述实体表征向量和所述方位关系表征向量输入到训练后的方位校正模型中,得到各方位关系空间中文档实体的方位标签序列,并基于所述方位标签序列对各所述文档实体进行位置校正,得到校正结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于润联软件系统(深圳)有限公司,未经润联软件系统(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110889386.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top