[发明专利]数据处理方法以及装置有效
申请号: | 202010340705.3 | 申请日: | 2020-04-26 |
公开(公告)号: | CN111241185B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 王潘安 | 申请(专利权)人: | 浙江网商银行股份有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 310012 浙江省杭州市西湖区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 以及 装置 | ||
本说明书实施例提供数据处理方法以及装置,其中所述数据处理方法包括:根据目标业务的历史业务数据确定业务主题,并基于与所述业务主题对应的业务数据表中的主题关键字构建初始主题表;将根据预设数据分析粒度以及所述业务主题的至少一个数据分析维度对所述历史业务数据进行数据分析获得的分析结果插入所述初始主题表的数据单元,以生成目标主题表;将所述目标主题表中的数据按照预先建立的初始数据仓库表的表结构进行数据同步处理,生成第一数据仓库表;再对所述业务数据表以及所述第一数据仓库表中包含的字段进行合并处理,生成目标数据仓库表。
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种数据处理方法。本说明书一个或者多个实施例同时涉及一种数据处理装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
数据仓库(Data Warehouse,可简写为DW或DWH)是一种结构化数据环境。数据仓库可以为数据分析、数据报表以及数据挖掘等应用提供数据支持,数据仓库管理是数据仓库运维的一个核心内容,且数据仓库管理通常包括数据维护以及数据仓库的建设评价等,数据仓库的任务主要是把信息加以整理归纳和重组,并及时提供给决策人员。
发明内容
有鉴于此,本说明书实施例提供了一种数据处理方法。本说明书一个或者多个实施例同时涉及一种数据处理装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种数据处理方法,包括:
根据目标业务的历史业务数据确定业务主题,并基于与所述业务主题对应的业务数据表中的主题关键字构建初始主题表;
根据预设数据分析粒度以及所述业务主题的至少一个数据分析维度对所述历史业务数据进行数据分析,将分析结果插入所述初始主题表的数据单元,生成目标主题表;
将所述目标主题表中的数据按照预先建立的初始数据仓库表的表结构进行同步处理,生成第一数据仓库表;
对所述业务数据表以及所述第一数据仓库表中包含的字段进行合并处理,生成目标数据仓库表。
可选地,所述根据目标业务的历史业务数据确定业务主题,并基于与所述业务主题对应的业务数据表中的主题关键字构建初始主题表,包括:
对所述历史业务数据进行主题域划分,将划分结果中目标主题域对应的主题确定为所述业务主题;
根据所述业务主题查询与所述业务主题对应的业务数据表;
以所述业务数据表中的主题关键字为目标字段构建所述初始主题表,其中,所述初始主题表还包括业务属性字段以及属性值字段。
可选地,所述初始数据仓库表通过以下方式进行构建:
以所述目标主题表中的主题关键字以及所述业务属性字段下的各个属性类别为目标字段构建所述初始数据仓库表。
可选地,所述初始数据仓库表通过以下方式进行构建:
根据预设筛选规则对所述目标主题表中所述业务属性字段下的各个属性类别进行筛选处理;
将筛选获得的目标属性类别以及所述目标主题表的主题关键字作为目标字段构建所述初始数据仓库表。
可选地,所述对所述业务数据表以及所述第一数据仓库表中包含的字段进行合并处理,生成目标数据仓库表,包括:
在所述第一数据仓库表中新增初始字段生成第二数据仓库表,其中,新增的所述初始字段的数目根据所述业务数据表中包含的字段数目确定;
确定所述业务数据表中主题关键字与各个字段中数据的映射关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江网商银行股份有限公司,未经浙江网商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010340705.3/2.html,转载请声明来源钻瓜专利网。