[发明专利]一种拉链表生成方法、装置、设备及介质在审
申请号: | 201910532415.6 | 申请日: | 2019-06-19 |
公开(公告)号: | CN110209891A | 公开(公告)日: | 2019-09-06 |
发明(设计)人: | 杨得力;杨晨;李杨 | 申请(专利权)人: | 河南中原消费金融股份有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/23;G06F16/21 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 丁曼曼 |
地址: | 450000 河南省*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拉链 历史数据记录 表生成 数据记录 字符串 表生成装置 运行稳定性 获取目标 集群设备 历史时刻 数据内容 运算资源 大数据 运维 字段 拼接 运算 仓库 占用 记录 | ||
1.一种拉链表生成方法,其特征在于,包括:
读取数据仓库中的目标数据表在历史时刻下的历史数据记录对应的历史特征值;其中,所述历史特征值是通过预先将所述历史数据记录中各字段的数据内容拼接为第一字符串,并对所述第一字符串进行Hash算法运算生成的;
获取所述目标数据表在当前时刻下与所述历史数据记录对应的当前数据记录;
将所述当前数据记录中各字段的数据内容拼接为第二字符串,并对所述第二字符串进行所述Hash算法运算生成当前特征值;
判断所述历史特征值与所述当前特征值是否存在差异;
如果是,则生成记录有所述历史数据记录的拉链表。
2.根据权利要求1所述的拉链表生成方法,其特征在于,所述读取数据仓库中的目标数据表在历史时刻下的历史数据记录对应的历史特征值,包括:
在预设的中间表中读取所述历史数据记录对应的所述历史特征值;其中,所述中间表基于所述目标数据表的字段增设有记录所述历史特征值的特征值字段。
3.根据权利要求1所述的拉链表生成方法,其特征在于,所述目标数据表的字段中包含有存储数据记录生效日期的数据记录生效日期字段,所述拉链表包含有数据记录生效日期字段以及数据记录失效日期字段。
4.根据权利要求1所述的拉链表生成方法,其特征在于,所述获取所述目标数据表在当前时刻下与所述历史数据记录对应的当前数据记录,包括:
获取所述目标数据表在当前时刻下与所述历史数据记录的主键字段内容相同的所述当前数据记录。
5.根据权利要求1所述的拉链表生成方法,其特征在于,所述Hash算法包括MD5 Hash算法。
6.根据权利要求1所述的拉链表生成方法,其特征在于,所述数据仓库包括Hive数据仓库。
7.根据权利要求1至6任意一项所述的拉链表生成方法,其特征在于,所述第一字符串以及所述第二字符串的数据类型均为字符串类型。
8.一种拉链表生成装置,其特征在于,包括:
历史特征获取模块,用于读取数据仓库中的目标数据表在历史时刻下的历史数据记录对应的历史特征值;其中,所述历史特征值是通过预先将所述历史数据记录中各字段的数据内容拼接为第一字符串,并对所述第一字符串进行Hash算法运算生成的;
当前数据获取模块,用于获取所述目标数据表在当前时刻下与所述历史数据记录对应的当前数据记录;
当前特征计算模块,用于将所述当前数据记录中各字段的数据内容拼接为第二字符串,并对所述第二字符串进行所述Hash算法运算生成当前特征值;
差异判断模块,用于判断所述历史特征值与所述当前特征值是否存在差异,如果是,则调用拉链表生成模块;
所述拉链表生成模块,用于生成记录有所述历史数据记录的拉链表。
9.一种拉链表生成设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的拉链表生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的拉链表生成方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南中原消费金融股份有限公司,未经河南中原消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910532415.6/1.html,转载请声明来源钻瓜专利网。