[发明专利]一种数据处理方法、装置、设备及介质在审
申请号: | 202110699578.0 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113344104A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 刘龙历;孙尚椿;于仰泉;朱冠胤;黄海 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06;G06F16/27 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 刘立升 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 设备 介质 | ||
1.一种数据处理方法,包括:
确定一个或多个数据子集;其中,每个所述数据子集对应一个时间子区间,所述数据子集包含目标对象对应的数据;
对任一所述数据子集,根据该数据子集的数据量判定是否对该数据子集执行子集聚合,所述子集聚合用于使该数据子集的数据量不超过第一预设数量;
确定目标时间区间,对所述目标时间区间对应的数据总集执行总集聚合,以确定所述数据总集所对应的第二预设数量个质心;其中,所述数据总集由所述目标时间区间所包含的一个或多个时间子区间所对应的数据子集组成;
根据所述第二预设数量个质心确定所述目标时间区间内所述目标对象的特征数据,所述特征数据用于识别所述目标对象是否存在风险。
2.如权利要求1所述的方法,确定一个或多个数据子集包括:
获取业务服务器上所产生的对应于目标对象的数据;
将所述对应于目标对象的数据按时间维度进行划分,以确定与时间子区间对应的一个或多个数据子集。
3.如权利要求1所述的方法,根据该数据子集的数据量判定是否对该数据子集执行子集聚合包括:
监测该数据子集的数据量;
若该数据子集的数据量超过第一预设数量,则对该数据子集执行子集聚合。
4.如权利要求1所述的方法,所述方法还包括:
对任一所述数据子集,若判定对该数据子集执行子集聚合,则对该数据子集的部分或全部数据进行子集聚合,得到该数据子集被聚合的数据对应的质心;
将被聚合的数据替换为所述质心;
其中,所述被聚合的数据对应的质心属于该数据子集;该数据子集被聚合的数据对应的质心数量与未被聚合的数据的数量之和不超过第一预设数量。
5.如权利要求4所述的方法,所述方法还包括:
对任一所述数据子集,对该数据子集执行过一次或多次子集聚合后,若该数据子集的数据量再次超过所述第一预设数据,则对该数据子集再次执行所述子集聚合。
6.如权利要求1所述的方法,对所述目标时间区间对应的数据总集执行总集聚合,以确定所述数据总集所对应的第二预设数量个质心包括:
对所述目标时间区间对应的数据总集内的数据执行逐轮聚合;其中,每一轮聚合用于确定所述数据总集对应的质心,首轮聚合基于所述数据总集内的数据,下一轮聚合基于上一轮聚合所得到的数据;
若某一轮聚合后数据总集对应的质心数量符合第二预设数量,则不再进行下一轮聚合。
7.如权利要求1所述的方法,根据所述第二预设数量个质心确定所述目标时间区间内所述目标对象的特征数据包括:
将所述第二预设数量个质心进行排序,得到质心序列;
根据所述质心序列确定所述数据总集的分位数的值;
将所述分位数的值作为所述目标时间区间内所述目标对象的特征数据。
8.如权利要求7所述的方法,根据所述质心序列确定所述数据总集的分位数的值包括:
每个质心序列中的质心对应一个分位数范围;
对任一分位数,确定该分位数落入的分位数范围,将该分位数落入的分位数范围对应的质心的平均数或加权平均数作为该分位数的值。
9.如权利要求8所述的方法,对任一分位数,若该分位数位于相邻两个相邻分位数范围的交叉点,则将所述两个相邻分位数范围对应的两个质心的mean值做平均或加权平均,将平均值或加权平均值作为该分位数的值;
或,
调整分位数范围的大小以便调整所述第二预设数量,并通过总集聚合重新计算调整后的各分位数范围对应的质心,确定该分位数落入的分位数范围,将该分位数落入的分位数范围对应的质心的平均数或加权平均数作为该分位数的值。
10.如权利要求1所述的方法,确定所述目标时间区间内所述目标对象的特征数据后,所述方法还包括:
使用所述特征数据表征所述目标对象在所述目标时间区间内的行为,以识别所述目标对象是否存在风险。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110699578.0/1.html,转载请声明来源钻瓜专利网。