[发明专利]表单处理方法、装置和系统、介质及计算机设备在审
申请号: | 202011617843.8 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112633278A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 詹明捷;梁鼎;刘学博 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/00;G06F40/30;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 靳玫 |
地址: | 100080 北京市海淀区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表单 处理 方法 装置 系统 介质 计算机 设备 | ||
本公开实施例提供一种表单处理方法、装置和系统、介质及计算机设备,利用多个待识别区域中文本行的属性信息,能够准确地挖掘出多个待识别区域中的不同待识别区域之间文本行的相对位置关系,再基于不同待识别区域之间文本行的相对位置关系生成待处理表单图像对应的结构化文本,从而使生成的结构化文本中各文本行的相对位置关系与各文本行在待处理表单图像中的相对位置关系相对应,提高了生成结构化文本的准确度。
技术领域
本公开涉及文本识别技术领域,尤其涉及表单处理方法、装置和系统、介质及计算机设备。
背景技术
光学字符识别(Optical Character Recognition,OCR)能够将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工。然而,在对表单进行识别时,常常无法基于表单的结构准确地生成结构化文本。
发明内容
本公开提供一种表单处理方法、装置和系统、介质及计算机设备。
根据本公开实施例的第一方面,提供一种表单处理方法,所述方法包括:获取待处理表单图像中多个待识别区域中文本行的属性信息;基于所述多个待识别区域中文本行的属性信息,确定所述多个待识别区域中的不同待识别区域之间文本行的相对位置关系;基于所述多个待识别区域中文本行的相对位置关系,生成所述待处理表单图像对应的结构化文本。
在一些实施例中,一个待识别区域中文本行的属性信息包括所述待识别区域中文本行的语义信息和/或位置信息。
在一些实施例中,所述多个待识别区域中包括参考区域和非参考区域;所述基于所述多个待识别区域中文本行的属性信息,确定所述多个待识别区域中的不同待识别区域之间文本行的相对位置关系,包括:基于所述参考区域中文本行的属性信息和所述非参考区域中文本行的属性信息,确定所述非参考区域中的文本行与所述参考区域中的文本行的相对位置关系。
在一些实施例中,所述基于所述参考区域中文本行的属性信息和所述非参考区域中文本行的属性信息,确定所述非参考区域中的文本行与所述参考区域中的文本行的相对位置关系,包括:基于所述参考区域中第一文本行的位置信息和所述非参考区域中第二文本行的位置信息,确定所述第一文本行与所述第二文本行在竖直方向上的位置重叠量;在所述位置重叠量大于预设值的情况下,确定所述第一文本行与所述第二文本行在所述结构化文本中处于同一行。
在一些实施例中,所述在所述位置重叠量大于预设值的情况下,确定所述第一文本行与所述第二文本行在所述结构化文本中处于同一行,包括:在所述第一文本行与多个第二文本行的位置重叠量均大于预设值的情况下,获取所述多个第二文本行整体的语义信息;在所述多个第二文本行整体的语义信息连续的情况下,确定所述第一文本行与所述多个第二文本行在所述结构化文本中处于同一行。
在一些实施例中,所述参考区域中的每个单元格仅包括一个文本行,所述非参考区域中每个单元格包括一个或多个文本行。
在一些实施例中,在所述获取待处理表单图像中多个待识别区域中文本行的属性信息之前,所述方法还包括:基于预设信息,从所述待处理表单图像中确定所述多个待识别区域;所述预设信息包括以下至少任一:所述待处理表单图像中的表头信息,所述待处理表单图像中的字段间距,所述待处理表单图像中字段的语义信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011617843.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高地隙全时四驱插秧机
- 下一篇:文本识别方法、装置和系统