[发明专利]一种数据处理方法、装置及其设备有效
申请号: | 201810582292.2 | 申请日: | 2018-06-07 |
公开(公告)号: | CN110647563B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 孙艳;黄晓婧;赵丹;陈国庆 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06Q50/26 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 及其 设备 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取原始输入数据,并根据所述原始输入数据创建源数据表;其中,所述源数据表的数据项包括对象与数据描述信息的对应关系;
根据所述源数据表创建仓库数据表,所述仓库数据表包括至少一个主题域;针对仓库数据表的主题域,从源数据表中选取与所述主题域对应的数据项,对选取的数据项进行处理,并在所述主题域下记录处理后的数据项;其中,所述主题域包括以下之一或任意组合:基本信息主题域、交通运行主题域、交通控制主题域、交通事件主题域、交通定位主题域、对象关系主题域;
从所述仓库数据表中确定与应用数据表关联的主题域;
根据所述主题域的数据项创建应用数据表。
2.根据权利要求1所述的方法,其特征在于,
所述根据所述原始输入数据创建源数据表,包括:
从所述原始输入数据中获取对象和数据描述信息;
若源数据表不存在所述对象的数据项,则在所述源数据表中添加数据项,通过所述数据项记录所述对象和所述数据描述信息;
若源数据表存在所述对象的数据项,在所述数据项添加所述数据描述信息。
3.根据权利要求1所述的方法,其特征在于,
所述根据所述源数据表创建仓库数据表之前,所述方法还包括:
为所述源数据表中的对象划分至少一个主题域。
4.根据权利要求1所述的方法,其特征在于,
所述根据所述源数据表创建仓库数据表之后,所述方法还包括:
根据所述仓库数据表创建集市数据表,所述集市数据表包括至少一个数据中心;针对集市数据表的数据中心,从仓库数据表选取与所述数据中心对应的数据项,对选取的数据项进行处理,并在所述数据中心下记录处理后的数据项。
5.根据权利要求4所述的方法,其特征在于,
所述根据所述仓库数据表创建集市数据表之前,所述方法还包括:
为所述仓库数据表中的数据项划分至少一个数据中心。
6.根据权利要求4或5所述的方法,其特征在于,所述数据中心包括以下一种或多种:车辆数据中心、事件数据中心、用户数据中心、设备数据中心、交通控制数据中心、出行数据中心、交通态势数据中心、交通网络数据中心。
7.根据权利要求4所述的方法,其特征在于,
所述根据所述仓库数据表创建集市数据表之后,所述方法还包括:
从所述集市数据表中确定与应用数据表关联的数据中心;
根据所述数据中心的数据项创建应用数据表;或者,
从所述仓库数据表中确定与应用数据表关联的主题域;
从所述集市数据表中确定与应用数据表关联的数据中心;
根据所述主题域的数据项以及所述数据中心的数据项创建应用数据表。
8.根据权利要求1所述的方法,其特征在于,所述仓库数据表中的数据项包括第一格式数据,所述应用数据表中的数据项包括第二格式数据;
所述方法还包括:通过查询公共维表,将所述仓库数据表中的数据项包括的第一格式数据,转换为所述应用数据表中的数据项包括的第二格式数据;
其中,所述公共维表用于记录第一格式数据与第二格式数据的对应关系。
9.根据权利要求1所述的方法,其特征在于,所述仓库数据表包括以下至少一种:基础数据子表,所述基础数据子表用于记录单一来源的数据;融合数据子表,所述融合数据子表用于记录多个来源的数据。
10.根据权利要求4所述的方法,其特征在于,
所述集市数据表包括以下至少一种:多维分析子表,所述多维分析子表用于记录多粒度的数据;基础标签子表,所述基础标签子表用于记录单粒度的单维度数据;宽表标签子表,所述宽表标签子表用于记录单粒度的多维度数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810582292.2/1.html,转载请声明来源钻瓜专利网。