[发明专利]电子表格数据处理方法、装置、计算机设备和存储介质在审
申请号: | 202110685527.2 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113553326A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 郭正昇;罗奕航 | 申请(专利权)人: | 深圳市金蝶天燕云计算股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 陈小娜 |
地址: | 518051 广东省深圳市南山区粤海街道高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子表格 数据处理 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种电子表格数据处理方法、装置、计算机设备和存储介质。所述方法包括:获取待处理的目标电子表格;获取目标电子表格中各个单元格的单元格特征,基于单元格特征对目标电子表格中单元格进行区域划分,得到多个目标单元格区域;获取候选表格组合策略集合中各个候选表格组合策略对应的表格评价分数,从候选表格组合策略集合中获取表格评价分数满足表格条件的候选表格组合策略,作为目标表格策略;将目标表格策略所对应的单元格区域关联关系对目标电子表格所对应的单元格进行分类,得到各个类别所对应的目标子表格,对目标子表格进行结构化信息提取,得到目标子表格对应的结构化信息。采用本方法能够提高电子表格数据处理的准确性。
技术领域
本申请涉及数据处理技术领域,特别是涉及一种电子表格数据处理方法、装置、计算机设备和存储介质。
背景技术
随着数据处理技术的发展,电子表格数据处理是数据处理技术中的重要分支,也得到了快速的发展。电子表格不但能够用于在电子设备中输入输出、显示数据,也能够用于帮助用户制作各种复杂的电子表格文档,进行数据计算,并能对输入的数据中复杂统计算后显示。因其应用的便利性和高效性,得到了广泛的应用,如何准确地处理电子表格数据显得尤为重要。
然而,目前的电子表格往往存在含有多级表头、一张表格内含多个子表格,结构灵活多变的情况,传统的电子表格数据处理方法对于结构复杂灵活多变的表格,存在处理效率低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高电子表格数据处理效率的电子表格数据处理方法、装置、计算机设备和存储介质。
一种电子表格数据处理方法,所述方法包括:获取待处理的目标电子表格;获取所述目标电子表格中各个单元格的单元格特征,基于所述单元格特征对所述目标电子表格中单元格进行区域划分,得到多个目标单元格区域;获取候选表格组合策略集合中各个候选表格组合策略对应的表格评价分数,从所述候选表格组合策略集合中获取表格评价分数满足表格条件的候选表格组合策略,作为目标表格策略;所述候选表格组合策略集合包括多个候选表格组合策略,所述候选表格组合策略为将具有关联关系的单元格区域组合成所述目标电子表格对应的子表格的策略;将所述目标表格策略所对应的单元格区域关联关系对所述目标电子表格所对应的单元格进行分类,得到各个类别所对应的目标子表格。
在其中一个实施例中,所述获取所述目标电子表格中各个单元格的单元格特征,基于所述单元格特征对所述目标电子表格中单元格进行区域划分,得到多个目标单元格区域包括:获取所述目标电子表格中各个单元格的单元格特征,基于所述单元格特征,从候选单元格类别集合中确定所述单元格对应的目标单元格类别;将目标单元格类别相同的连续单元格进行合并,得到多个目标单元格区域。
在其中一个实施例中,所述获取所述目标电子表格中各个单元格的单元格特征,基于所述单元格特征,从候选单元格类别集合中确定所述单元格对应的目标单元格类别包括:确定待确定特征的当前单元格以及所述当前单元格对应的相邻单元格;将所述当前单元格的单元格数据属性信息与所述相邻单元格的单元格数据属性信息进行比较,得到比较结果;基于所述比较结果得到所述当前单元格对应的单元格特征。
在其中一个实施例中,所述获取所述目标电子表格中各个单元格的单元格特征,基于所述单元格特征,从候选单元格类别集合中确定所述单元格对应的目标单元格类别包括:获取所述目标电子表格中各个单元格的单元格特征,将所述单元格特征输入到单元格类别分类模型中,所述单元格类别分类模型输出所述候选单元格类别集合中各个候选单元格类别对应的类别可能度;所述候选单元格类别集合包括表头类别、数据类别、数据组标识类别或者附属类别中的至少一个;从所述候选单元格类别集合中筛选得到类别可能度大于类别可能度阈值的候选单元格类别,作为所述单元格对应的目标单元格类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市金蝶天燕云计算股份有限公司,未经深圳市金蝶天燕云计算股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110685527.2/2.html,转载请声明来源钻瓜专利网。