[发明专利]一种数据处理方法、装置及设备在审
申请号: | 201910213125.5 | 申请日: | 2019-03-20 |
公开(公告)号: | CN111723161A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 王烨;周祥 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2455;G06F16/2458 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 设备 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取数据处理请求,所述数据处理请求包括数据源的位置信息;
根据所述位置信息从所述数据源的数据集中获取属性信息;其中,所述数据源包括多个数据集,且所述数据集包括所述数据集的属性信息;
根据所述属性信息创建数据表,所述数据表对应至少一个数据集,并将所述至少一个数据集对应的元信息与所述数据表进行关联;
利用所述数据表和所述数据表关联的元信息进行数据处理。
2.根据权利要求1所述的方法,其特征在于,
根据所述属性信息创建数据表,所述数据表对应至少一个数据集,包括:
根据所述多个数据集分别对应的属性信息,对所述多个数据集进行聚类,得到聚类集合,其中,所述聚类集合包括至少一个数据集;
为所述聚类集合创建数据表,所述数据表对应所述至少一个数据集。
3.根据权利要求2所述的方法,其特征在于,根据所述多个数据集分别对应的属性信息,对所述多个数据集进行聚类,得到聚类集合,包括:
获取聚类指示信息,所述聚类指示信息用于指示聚类子属性;
基于所述多个数据集分别对应的属性信息,根据所述聚类指示信息确定所述多个数据集分别对应的聚类子属性,并根据所述多个数据集分别对应的聚类子属性,对所述多个数据集进行聚类,得到聚类集合。
4.根据权利要求3所述的方法,其特征在于,根据所述多个数据集分别对应的聚类子属性,对所述多个数据集进行聚类,得到聚类集合,包括:
基于所述多个数据集分别对应的聚类子属性,将聚类子属性相同的数据集聚类到同一聚类集合,将聚类子属性不同的数据集聚类到不同的聚类集合。
5.根据权利要求3所述的方法,其特征在于,获取聚类指示信息,包括:
若所述数据处理请求还包括聚类指示信息,则从所述数据处理请求中获取所述聚类指示信息;或者,获取预先配置的聚类指示信息。
6.根据权利要求2所述的方法,其特征在于,根据所述多个数据集分别对应的属性信息,对所述多个数据集进行聚类,得到聚类集合,包括:
若所述数据处理请求还包括过滤指示信息,则根据所述过滤指示信息对所述多个数据集进行过滤,得到目标数据集;基于所述目标数据集对应的属性信息,对所述目标数据集进行聚类,得到聚类集合。
7.根据权利要求1所述的方法,其特征在于,
根据所述位置信息从所述数据源的数据集中获取属性信息,包括:
判断是否为所述数据处理请求使能数据表发现功能;
如果是,则根据所述位置信息从所述数据源的数据集中获取属性信息。
8.根据权利要求7所述的方法,其特征在于,
所述判断是否为所述数据处理请求使能数据表发现功能,包括:
若所述数据处理请求还包括自动发现指示信息,则根据所述自动发现指示信息判断是否为所述数据处理请求使能数据表发现功能。
9.根据权利要求1所述的方法,其特征在于,
所述根据所述属性信息创建数据表之后,还包括:若所述数据处理请求还包括命名指示信息,则根据所述命名指示信息对所述数据表进行命名。
10.根据权利要求1所述的方法,其特征在于,
所述将所述至少一个数据集对应的元信息与所述数据表进行关联,包括:
根据所述至少一个数据集对应的属性信息,确定所述至少一个数据集对应的元信息,并将所述元信息与所述数据表进行关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910213125.5/1.html,转载请声明来源钻瓜专利网。