[发明专利]一种数据预处理方法、装置及其存储介质在审
申请号: | 201910572792.2 | 申请日: | 2019-06-28 |
公开(公告)号: | CN112148804A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 郭泽渊 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/25;G06F16/27 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 郑红娟;宋志强 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 预处理 方法 装置 及其 存储 介质 | ||
本发明公开了一种数据预处理方法、装置及其存储介质,该方法包括当预定的至少一个预调用触发条件触发时,从预设的数据源中获取与所述预调用触发条件具有共同数据特征的热点数据,其中,所述热点数据为预调用触发条件触发时数据源中待进行预处理的数据;对所述热点数据进行调用前的预处理;将预处理后的热点数据分配为多组数据;将分配后的多组数据分别根据预定规则存储在多个存储单元中。通过上述的方法对数据源中海量数据进行了分类,将有可能需要进行预处理的数据进行预先的预处理,并分别存储在不同的存储单元中,提供了一种在大数据处理中的高可用技术方案。解决了在数据处理量巨大的条件下,现有技术无法满足性能需求的技术问题。
技术领域
本发明涉及计算机领域,尤其是指一种数据预处理方法、装置及其存储介质。
背景技术
随着大数据的发展,数据处理的复杂程度不断提高。比如在电商领域,对支付数据和对应的期限数据需要进行海量数据的处理。以电商的白条业务为例,属于一款信贷产品,每笔交易、每一次领取优惠券、每次额度提升,都需要严格的风险控制。
在巨量的消费限额、历史单量、逾期天数等数据面前,不仅数据的处理量激增,还需要对这些数据进行预处理(流水中计算、统计汇总等),以便用户调用或系统自动调用,但是现在的处理方式在高并发的交易时,无法满足性能上的要求。以今年双十一为例,来自整个交易链路的查询QPS已超过40W(即数据的调用),而以标准物理机(128G内存,32核CPU)来看,性能测试得到的数据,仅可同时支持3000TPS和10000QPS,远远无法满足大促流量峰值的数据处理要求。
所以发明人发现现有技术中至少存在如下问题,由于数据处理量巨大状态下,现有技术无法满足性能需求的技术问题。
发明内容
本申请提供了一种数据预处理方法,该方法包括:
当预定的至少一个预调用触发条件触发时,从预设的数据源中获取与所述预调用触发条件具有共同数据特征的热点数据,其中,所述热点数据为预调用触发条件触发时数据源中待进行预处理的数据;
对所述热点数据进行调用前的预处理;
将预处理后的热点数据分配为多组数据;
将分配后的多组数据分别根据预定规则存储在多个存储单元中。
可选地,将分配后的多组数据分别根据预定规则存储在预建的多个存储单元中包括:
将预建的多个存储单元按第二预定方式分配为多个存储单元集群;
获取所述存储单元集群中的存储单元状态,其中,所述存储单元状态为存储单元是否可以存储热点数据;
根据所述存储单元状态按预定条件选取目标集群,其中,所述目标集群为多个所述存储单元集群中符合预定条件的集群;
将分配后的多组数据根据预定规则存储在所述目标集群的存储单元中。
可选地,所述将分配后的多组数据分别根据预定规则存储在预建的多个存储单元中,其中,所述存储单元用于数据的存储和读取步骤后,该方法还包括:
接收权限配置信息,其中,所述权限配置信息为获取所述存储单元中数据的权限配置;
获取所述权限配置信息的生效指令;
根据所述生效指令按所述权限配置信息对本地的权限配置进行更新。
可选地,所述将分配后的多组数据分别根据预定规则存储在预建的多个存储单元中步骤后,该方法还包括:
接收用于调用所述存储单元数据的调用指令;
根据本地的权限配置对所述调用指令进行识别,得到符合权限配置的调用指令;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910572792.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置