[发明专利]大数据处理方法及平台在审
申请号: | 201410113875.2 | 申请日: | 2014-03-25 |
公开(公告)号: | CN104951446A | 公开(公告)日: | 2015-09-30 |
发明(设计)人: | 岳赟;黄冀;宁智 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/06 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 党晓林 |
地址: | 英属开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 平台 | ||
1.一种大数据处理方法,其特征在于,包括:
接收包含用户第一数据的请求信息;
如果所述第一数据大于预定限额,查询所述用户的历史数据;
基于所述历史数据在聚类后的分类中查找对应分类;
将查找到的对应分类按照预定映射规则得到动态额度;
如果所述第一数据不大于预定限额与动态额度之和,则批准所述请求信息。
2.如权利要求1所述的方法,其特征在于,所述请求信息含订单信息,所述第一数据包括订单信息中的待支付金额。
3.如权利要求2所述的方法,其特征在于,
所述订单信息包括单一场景下的订单信息,所述预定限额包括单一场景下的预定限额;
或,
所述订单信息包括不同场景下的订单信息,所述预定限额包括不同场景下的预定限额。
4.如权利要求1或3所述的方法,其特征在于,所述预定限额通过以下方式得到:
将用户的历史订单中的订单金额排序;
将符合下式的di判断为离群点:
|di-di-k|>C,i=k+1,…,n
上式中,i表示第i笔订单,d1,d2,…,dn是按照订单金额排序后的订单金额,C为给定的阈值,k为预设距离;
剔除离群点;
将剔除离群点后的群落中的最大值设为预定限额。
5.如权利要求1所述的方法,其特征在于,所述聚类后的分类包括对预定数量的大数据进行聚类处理后得到的分类。
6.如权利要求5所述的方法,其特征在于,所述对预定数量的大数据进行聚类处理包括:
结合最近一次消费、消费频率和消费金额这三项指标对预定数量的大数据进行聚类处理。
7.一种大数据处理平台,其特征在于,包括:
接收单元,用于接收包含用户第一数据的请求信息;
查询单元,用于当所述第一数据大于预定限额时,查询所述用户的历史数据;
查找单元,基于所述历史数据在聚类后的分类中查找对应分类;
映射单元,用于将查找到的对应分类按照预定映射规则得到动态额度;
审核单元,用于当所述第一数据不大于预定限额与动态额度之和时,批准所述请求信息。
8.如权利要求7所述的大数据处理平台,其特征在于,所述请求信息含订单信息,所述第一数据包括订单信息中的待支付金额。
9.如权利要求7所述的大数据处理平台,其特征在于,
所述订单信息包括单一场景下的订单信息,所述预定限额包括单一场景下的预定限额;
或,
所述订单信息包括不同场景下的订单信息,所述预定限额包括不同场景下的预定限额。
10.如权利要求7或9所述的大数据处理平台,其特征在于,还包括预定限额计算单元,所述预定限额计算单元包括:
排序单元,用于将用户的历史订单中的订单金额排序;
判断单元,用于将符合下式的di判断为离群点:
|di-di-k|>C,i=k+1,…,n
上式中,i表示第i笔订单,d1,d2,…,dn是按照订单金额排序后的订单金额,C为给定的阈值,k为预设距离;
剔除单元,用于剔除离群点;
设置单元,用于将剔除离群点后的群落中的最大值设为预定限额。
11.如权利要求7所述的大数据处理平台,其特征在于,所述聚类后的分类包括对预定数量的大数据进行聚类处理后得到的分类。
12.如权利要求11所述的大数据处理平台,其特征在于,所述所述聚类后的分类包括:
结合最近一次消费、消费频率和消费金额这三项指标对预定数量的大数据进行聚类处理后得到的分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410113875.2/1.html,转载请声明来源钻瓜专利网。