[发明专利]一种数据预处理方法、装置及其存储介质在审

专利信息
申请号: 201910572792.2 申请日: 2019-06-28
公开(公告)号: CN112148804A 公开(公告)日: 2020-12-29
发明(设计)人: 郭泽渊 申请(专利权)人: 京东数字科技控股有限公司
主分类号: G06F16/28 分类号: G06F16/28;G06F16/25;G06F16/27
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 郑红娟;宋志强
地址: 100176 北京市北京经济*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 预处理 方法 装置 及其 存储 介质
【说明书】:

发明公开了一种数据预处理方法、装置及其存储介质,该方法包括当预定的至少一个预调用触发条件触发时,从预设的数据源中获取与所述预调用触发条件具有共同数据特征的热点数据,其中,所述热点数据为预调用触发条件触发时数据源中待进行预处理的数据;对所述热点数据进行调用前的预处理;将预处理后的热点数据分配为多组数据;将分配后的多组数据分别根据预定规则存储在多个存储单元中。通过上述的方法对数据源中海量数据进行了分类,将有可能需要进行预处理的数据进行预先的预处理,并分别存储在不同的存储单元中,提供了一种在大数据处理中的高可用技术方案。解决了在数据处理量巨大的条件下,现有技术无法满足性能需求的技术问题。

技术领域

本发明涉及计算机领域,尤其是指一种数据预处理方法、装置及其存储介质。

背景技术

随着大数据的发展,数据处理的复杂程度不断提高。比如在电商领域,对支付数据和对应的期限数据需要进行海量数据的处理。以电商的白条业务为例,属于一款信贷产品,每笔交易、每一次领取优惠券、每次额度提升,都需要严格的风险控制。

在巨量的消费限额、历史单量、逾期天数等数据面前,不仅数据的处理量激增,还需要对这些数据进行预处理(流水中计算、统计汇总等),以便用户调用或系统自动调用,但是现在的处理方式在高并发的交易时,无法满足性能上的要求。以今年双十一为例,来自整个交易链路的查询QPS已超过40W(即数据的调用),而以标准物理机(128G内存,32核CPU)来看,性能测试得到的数据,仅可同时支持3000TPS和10000QPS,远远无法满足大促流量峰值的数据处理要求。

所以发明人发现现有技术中至少存在如下问题,由于数据处理量巨大状态下,现有技术无法满足性能需求的技术问题。

发明内容

本申请提供了一种数据预处理方法,该方法包括:

当预定的至少一个预调用触发条件触发时,从预设的数据源中获取与所述预调用触发条件具有共同数据特征的热点数据,其中,所述热点数据为预调用触发条件触发时数据源中待进行预处理的数据;

对所述热点数据进行调用前的预处理;

将预处理后的热点数据分配为多组数据;

将分配后的多组数据分别根据预定规则存储在多个存储单元中。

可选地,将分配后的多组数据分别根据预定规则存储在预建的多个存储单元中包括:

将预建的多个存储单元按第二预定方式分配为多个存储单元集群;

获取所述存储单元集群中的存储单元状态,其中,所述存储单元状态为存储单元是否可以存储热点数据;

根据所述存储单元状态按预定条件选取目标集群,其中,所述目标集群为多个所述存储单元集群中符合预定条件的集群;

将分配后的多组数据根据预定规则存储在所述目标集群的存储单元中。

可选地,所述将分配后的多组数据分别根据预定规则存储在预建的多个存储单元中,其中,所述存储单元用于数据的存储和读取步骤后,该方法还包括:

接收权限配置信息,其中,所述权限配置信息为获取所述存储单元中数据的权限配置;

获取所述权限配置信息的生效指令;

根据所述生效指令按所述权限配置信息对本地的权限配置进行更新。

可选地,所述将分配后的多组数据分别根据预定规则存储在预建的多个存储单元中步骤后,该方法还包括:

接收用于调用所述存储单元数据的调用指令;

根据本地的权限配置对所述调用指令进行识别,得到符合权限配置的调用指令;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910572792.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top