[发明专利]电子表格数据处理方法、装置、计算机设备和存储介质在审
申请号: | 202110685527.2 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113553326A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 郭正昇;罗奕航 | 申请(专利权)人: | 深圳市金蝶天燕云计算股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 陈小娜 |
地址: | 518051 广东省深圳市南山区粤海街道高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子表格 数据处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种电子表格数据处理方法,其特征在于,所述方法包括:
获取待处理的目标电子表格;
获取所述目标电子表格中各个单元格的单元格特征,基于所述单元格特征对所述目标电子表格中单元格进行区域划分,得到多个目标单元格区域;
获取候选表格组合策略集合中各个候选表格组合策略对应的表格评价分数,从所述候选表格组合策略集合中获取表格评价分数满足表格条件的候选表格组合策略,作为目标表格策略;所述候选表格组合策略集合包括多个候选表格组合策略,所述候选表格组合策略为将具有关联关系的单元格区域组合成所述目标电子表格对应的子表格的策略;
将所述目标表格策略所对应的单元格区域关联关系对所述目标电子表格所对应的单元格进行分类,得到各个类别所对应的目标子表格;
对所述目标子表格进行结构化信息提取,得到所述目标子表格对应的结构化信息。
2.根据权利要求1所述的方法,其特征在于,所述获取所述目标电子表格中各个单元格的单元格特征,基于所述单元格特征对所述目标电子表格中单元格进行区域划分,得到多个目标单元格区域包括:
获取所述目标电子表格中各个单元格的单元格特征,基于所述单元格特征,从候选单元格类别集合中确定所述单元格对应的目标单元格类别;
将目标单元格类别相同的连续单元格进行合并,得到多个目标单元格区域。
3.根据权利要求2所述的方法,其特征在于,所述获取所述目标电子表格中各个单元格的单元格特征,基于所述单元格特征,从候选单元格类别集合中确定所述单元格对应的目标单元格类别包括:
确定待确定特征的当前单元格以及所述当前单元格对应的相邻单元格;
将所述当前单元格的单元格数据属性信息与所述相邻单元格的单元格数据属性信息进行比较,得到比较结果;
基于所述比较结果得到所述当前单元格对应的单元格特征。
4.根据权利要求2所述的方法,其特征在于,所述获取所述目标电子表格中各个单元格的单元格特征,基于所述单元格特征,从候选单元格类别集合中确定所述单元格对应的目标单元格类别包括:
获取所述目标电子表格中各个单元格的单元格特征,将所述单元格特征输入到单元格类别分类模型中,所述单元格类别分类模型输出所述候选单元格类别集合中各个候选单元格类别对应的类别可能度;所述候选单元格类别集合包括表头类别、数据类别、数据组标识类别或者附属类别中的至少一个;
从所述候选单元格类别集合中筛选得到类别可能度大于类别可能度阈值的候选单元格类别,作为所述单元格对应的目标单元格类别。
5.根据权利要求1所述的方法,其特征在于,所述获取候选表格组合策略集合中各个候选表格组合策略对应的表格评价分数包括:
确定当前候选表格组成策略;
获取利用当前候选表格组合策略对单元格区域进行组合所对应的当前子表格集合;
获取当前子表格集合中各个当前子表格对应的当前表格评价分数;
对当前子表格对应的当前表格评价分数进行统计,得到当前候选表格组合策略对应的当前表格评价分数。
6.根据权利要求5所述的方法,其特征在于,所述从所述候选表格组合策略集合中获取表格评价分数满足表格条件的候选表格组合策略,作为目标表格策略包括:
朝着使当前表格评价分数满足表格条件的方向对当前候选表格组成策略进行调整,得到更新后的当前候选表格组成策略;
返回获取利用当前候选表格组合策略对单元格区域进行组合所对应的当前子表格集合的步骤,直至满足表格条件,将满足表格条件的当前候选表格组成策略作为目标表格策略。
7.根据权利要求5所述的方法,其特征在于,所述获取当前子表格集合中各个当前子表格对应的当前表格评价分数包括:
获取组成所述当前子表格对应的当前单元格区域集合;
获取所述当前单元格区域集合中各个当前单元格区域对应的当前单元格类别;
基于所述当前单元格类别所对应的当前单元格数据得到当前子表格对应的当前表格评价分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市金蝶天燕云计算股份有限公司,未经深圳市金蝶天燕云计算股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110685527.2/1.html,转载请声明来源钻瓜专利网。