[发明专利]在电子表格数据上添加机器理解在审

专利信息
申请号: 202110047733.0 申请日: 2021-01-14
公开(公告)号: CN112800773A 公开(公告)日: 2021-05-14
发明(设计)人: 林伟豪;维什努·西瓦吉 申请(专利权)人: 谷歌有限责任公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/279
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 周亚荣;邓聪惠
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 电子表格 数据 添加 机器 理解
【说明书】:

本公开涉及在电子表格数据上添加机器理解。一种基于对电子表格数据的机器理解来生成图表推荐的方法,包括确定数据集,每项数据均包括呈现给用户的电子表格的列中的一个或多个单元格的单元格的内容。该方法还基于该数据集来确定与该列相关联的实体类型。实体类型表示数据集在电子表格的列中的的语义含义。该方法还标识多个图表中和与该列相关联的实体类型相关的至少一个图标。然后,该方法提供所标识的图表以呈现给用户。

技术领域

本公开的方面和实施方式涉及电子文档,并且更具体地涉及在电子表格数据上添加机器理解。

背景技术

电子表格文档可用于组织和分析大量信息。电子表格文档中的信息可以包含在一张或多张工作表上按行和列排列的单元格中。例如,电子表格可以用于管理和操纵财务信息、工程信息或任何组织信息。用户可以使用电子表格软件应用来操纵(例如,创建、编辑、查看、打印等)电子表格。当编辑电子表格时,用户可以通过移除文本、输入新文本、格式化电子表格布局、添加图形或图表或以其他方式更改电子表格的内容来更改电子表格的内容。

发明内容

下文是本公开的简要发明内容以便提供对本公开的一些方面的基本理解。本发明内容不是本公开的广泛概述。它既不旨在标识本公开的关键或决定性要素,也不旨在刻划本公开的特定实施例的任何范围或权利要求的任何范围。其唯一目的是以简化形式呈现本公开的一些概念作为稍后呈现的更详细描述的序言。

公开了一种用于在电子表格数据上增加机器理解的系统和方法。处理设备可以确定数据集,每项数据均包括呈现给用户的电子表格的列中的单元格的内容。处理设备可以基于该数据集而确定与该列相关联的实体类型。该实体类型可以表示在该列中该数据集的语义含义。

在一些实施方式中,为了确定与该列相关联的实体类型,处理设备可以标识与该列中的每个单元格相关联的知识图上的一个或多个实体。知识图可以被描述为具有关于多个语义实体以及这些语义实体之间的关系连接的结构化信息的知识库。知识图的节点可以表示实体,并且实体之间的关系连接可以由边来表示。知识图可以是公共知识图或私人维持的知识图。

为了标识每个单元格的一个或多个实体,处理设备可以将单元格中的数据与知识图上的节点进行比较。然后,处理设备可以基于该列中共享实体类型的单元格的数目而确定该列的一种或多种共同共享的实体类型。要被视为该列的共同共享的实体类型,共享该实体类型的单元格数目必须满足阈值条件。例如,共享实体类型的单元格数目必须超过列中单元格的95%,才能被视为该列的共同共享的实体类型。然后,该方法可以通过选择在该列中最多数目的单元格之间共享的共同共享的实体类型来确定该列的实体类型。

在一个实施例中,处理设备然后可以标识与和该列相关联的实体类型相关的至少一个图表。处理设备可以基于将该列的语义含义纳入考虑的规则集,或者基于机器学习模型的输出,而对各种图表类型进行评分。该规则集可以指导针对与该列相关联的特定语义含义应该考虑哪些图表,和/或应当为所考虑的图表中的每个指派什么分值。规则对于不同的用户或不同级别或类别的用户可能是不同的,并且可以基于用户输入而预确定或配置规则。可以训练机器学习模型,以基于从该列的语义含义得出的一种或多种实体类型,以及可选地基于用户的一种或多种特征,而向每种图表类型指派分值。处理设备可以基于它们的分值而对图表类型进行排名,并且可以提供最相关的图表类型(即,具有最高分值的图表类型)以呈现给用户。另外地或替代地,处理设备可以基于图表类型的排名而向用户提供一种以上的推荐的图表类型。例如,处理设备可以基于排名而将前N个图表类型提供给用户作为推荐,其中N是整数。作为另一示例,处理设备可以向用户提供具有满足阈值条件的分值的一个或多个图表作为推荐。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110047733.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top