[发明专利]表格生成方法、装置、电子设备及存储介质有效
申请号: | 202110945523.3 | 申请日: | 2021-08-17 |
公开(公告)号: | CN113657274B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 庾悦晨;李煜林;章成全;姚锟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/414;G06V30/148 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;臧建明 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表格 生成 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种表格生成方法、装置、电子设备及存储介质,涉及人工智能领域;具体为计算机视觉和深度学习技术领域,可应用于智慧城市和智慧金融场景下。具体实现方案为:识别待识别图像中的至少一个表格对象,获得所述至少一个表格对象分别对应的表格属性;其中,任一个表格对象的表格属性包括单元格属性或非单元格属性;确定所述至少一个表格对象中具有单元格属性的至少一个目标对象;确定所述至少一个目标对象分别对应的单元格区域,获得所述至少一个目标对象分别对应的单元格位置信息;根据所述至少一个目标对象分别对应的单元格位置信息,生成所述待识别图像对应的电子表格。本公开的技术方案提高了表格生成精度。
技术领域
本公开涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于智慧城市和智慧金融场景下,尤其涉及一种表格生成方法、装置、电子设备及存储介质。
背景技术
OCR(Optical Character Recognition,光学字符识别)技术,是指电子设备检测纸质上打印的字符,通过检测明暗等模式确定图像的表格形状,然后字符识别方法获得以计算机语言表示的文字的过程。
现有技术中,OCR技术识别表格的识别方式准确度不高,识别精度较差。
发明内容
本公开提供了一种用于表格生成的方法、装置、电子设备及存储介质。
根据本公开的第一方面,提供了一种表格生成方法,包括:
识别待识别图像中的至少一个表格对象,获得所述至少一个表格对象分别对应的表格属性;其中,任一个表格对象的表格属性包括单元格属性或非单元格属性;
确定所述至少一个表格对象中具有单元格属性的至少一个目标对象;
确定所述至少一个目标对象分别对应的单元格区域,获得所述至少一个目标对象分别对应的单元格位置信息;
根据所述至少一个目标对象分别对应的单元格位置信息,生成所述待识别图像对应的电子表格。
根据本公开的第二方面,提供了一种表格生成装置,包括:
属性识别单元,用于识别待识别图像中的至少一个表格对象,获得所述至少一个表格对象分别对应的表格属性;其中,任一个表格对象的表格属性包括单元格属性或者非单元格属性中;
对象确定单元,用于确定所述至少一个表格对象中具有单元格属性的至少一个目标对象;
区域确定单元,用于确定所述至少一个目标对象分别对应的单元格区域,获得所述至少一个目标对象分别对应的单元格位置信息;
表格生成单元,用于根据所述至少一个目标对象分别对应的单元格位置信息,生成所述待识别图像对应的电子表格。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器以及与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
根据本公开的第四方面,提供了存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面所述的方法。
根据本公开的第五方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110945523.3/2.html,转载请声明来源钻瓜专利网。