[发明专利]一种文本图像中表格的结构化信息的识别方法及装置有效
申请号: | 202010079924.0 | 申请日: | 2020-02-04 |
公开(公告)号: | CN111259854B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 刘宁;吴志超;王静;胡茜;董婉;申亚男 | 申请(专利权)人: | 北京爱医生智慧医疗科技有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/146;G06V30/148;G06F40/174;G06F40/177 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王宇杨 |
地址: | 102206 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 表格 结构 信息 识别 方法 装置 | ||
本发明实施例提供一种文本图像中表格的结构化信息的识别方法及装置,所述方法包括:在所述文本图像中确定属于同一个表格内的表格线,确定与所述表格线的方向相垂直的第一目标坐标轴;确定所述同一个表格内的初始单元格;确定相邻两个初始单元格的交线,构建包含所述交线的多边形,确定所述多边形的包围区域内的线段像素数,并根据所述线段像素数和预设阈值的比较结果,确定是否合并相邻两个初始单元格;遍历所有相邻两个初始单元格,并根据合并结果确定结构化信息的识别结果。所述装置执行上述方法。本发明实施例提供的方法及装置,能够自动和准确地识别文本图像中表格的结构化信息。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文本图像中表格的结构化信息的识别方法及装置。
背景技术
随着人工智能技术的发展,在工业领域得到了越来越广泛的应用。人工智能技术在深入到工业系统中后,在一些机械性、重复性的劳动过程中,可以部分替代人工,或者说辅助人工,以提高人的生产效率,降低企业的生产成本。这一技术框架被称之为机器人流程自动化(Robotic Process Automation,简称“RPA”)。
RPA的一个典型应用是企业的合同文本的自动化处理流程。一个企业在生产过程中,有大量的合同需要处理,如各类原料采购合同和设备销售合同等。由于合同涉及到多类供方或需方,且合同内容因具体业务而不同,合同内容并不标准。企业往往需要雇佣多位财务人员,每天对各类合同进行人工审核和标准化处理,人工审核成本高,且容易出错。
本发明实施例的背景是利用人工智能技术,将企业的大量纸质合同进行统一扫描或拍照,将这些合同进行电子化,得到包含表格的文本图像,然后,进行光学字符识别(Optical Character Recognition,简称“OCR”),将图片中的文字及其坐标提取出来。在这基础之上,为了进一步分析文本图像中表格的结构化信息,需要识别上述结构化信息。
发明内容
针对现有技术存在的问题,本发明实施例提供一种文本图像中表格的结构化信息的识别方法及装置。
本发明实施例提供一种文本图像中表格的结构化信息的识别方法,包括:
在所述文本图像中确定属于同一个表格内的表格线,确定与所述表格线的方向相垂直的第一目标坐标轴;
获取所述同一个表格内的文字度量信息、所述表格线在所述第一目标坐标轴上的坐标,并根据与所述文字度量信息相对应的、相同方向的相邻两条表格线对应的相邻坐标和所述文字度量信息,确定所述同一个表格内的初始单元格;
确定相邻两个初始单元格的交线,构建包含所述交线的多边形,确定所述多边形的包围区域内的线段像素数,并根据所述线段像素数和预设阈值的比较结果,确定是否合并相邻两个初始单元格;
遍历所有相邻两个初始单元格,并根据合并结果确定所述同一个表格内的最终单元格,并将所有最终单元格作为结构化信息的识别结果。
其中,所述文字度量信息包括文字宽度信息和文字高度信息;相应的,所述根据与所述文字度量信息相对应的、相同方向的相邻两条表格线对应的相邻坐标和所述文字度量信息,确定所述同一个表格内的初始单元格,包括:
若所述文字度量信息为所述文字宽度信息,则计算竖直方向的相邻两条表格线对应的相邻横坐标之间的横坐标差值,并根据所述横坐标差值与所述文字宽度信息,确定所述同一个表格内的列数;
若所述文字度量信息为所述文字高度信息,则计算水平方向的相邻两条表格线对应的相邻竖坐标之间的竖坐标差值,并根据所述竖坐标差值与所述文字高度信息,确定所述同一个表格内的行数;
根据所述列数和所述行数,确定所述同一个表格内的初始单元格。
其中,所述根据所述横坐标差值与所述文字宽度信息,确定所述同一个表格内的列数,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱医生智慧医疗科技有限公司,未经北京爱医生智慧医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010079924.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电机运动控制方法
- 下一篇:一种制作动画的方法、装置及存储介质
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序