[发明专利]一种数据处理方法和相关装置在审
申请号: | 202110217143.8 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112837061A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 李成 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q20/38 | 分类号: | G06Q20/38;G06Q20/40;G06K9/62 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 常忠良 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 相关 装置 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取样本用户标识和对应的样本用户行为数据,所述样本用户标识标注有对应的用户类别,所述用户类别包括正常用户和异常用户,所述样本用户行为数据用于确定所述样本用户标识对应用户的用户交易行为;
根据所述样本用户标识和所述样本用户行为数据生成分类树,所述分类树的叶节点为所述样本用户标识,所述分类树的枝节点为所述用户交易行为,所述分类树中从根节点到任一叶节点的分支用于标识至少一个样本用户标识对应的样本用户行为数据;
将用户类别为异常用户的样本用户标识占比超过第一预设阈值的叶节点确定为目标叶节点,将所述目标叶节点对应的父节点确定为特征用户交易行为;
获取待分类用户标识和对应的待分类用户行为数据;
若根据目标待分类用户行为数据确定出所述特征用户交易行为,将所述目标待分类用户行为数据对应的目标待分类用户标识存入待分类集合,所述待分类集合中的待分类用户标识用于进行标识分类。
2.根据权利要求1所述的方法,其特征在于,所述根据所述样本用户标识和所述样本用户行为数据生成分类树,包括:
统计目标样本用户标识对应的目标样本用户行为数据中各个行为内容的行为次数和行为频率;
基于所述行为内容、行为次数和行为频率,确定所述用户交易行为;
将所述用户交易行为作为枝节点生成所述分类树。
3.根据权利要求1所述的方法,其特征在于,所述待分类用户行为数据中包括所述待分类用户标识对应的行为内容,所述行为内容包括交易时间、交易金额特征、交易时间特征中的任意一种或多种的组合,所述交易时间特征用于标识所述行为内容发生的时间是否为特殊时间,所述交易金额特征用于标识所述行为内容涉及的交易金额是否为特殊数值。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据所述第一待分类用户标识对应的分类场景确定分组时间区间;
通过所述分组时间区间和所述交易时间,对所述第一待分类用户标识对应的第一待分类用户行为数据中包括的行为内容进行分组处理;
获取目标行为内容组中的多个行为内容;
根据所述多个行为内容确定所述目标行为内容组对应的特征行为内容;
将所述第一待分类用户行为数据中的所述多个行为内容替换为所述特征行为内容。
5.根据权利要求4所述的方法,其特征在于,所述根据所述多个行为内容确定所述目标行为内容组对应的特征行为内容,包括:
通过词向量模型确定所述多个行为内容之间的相似度;
若所述多个行为内容之间相似度均满足第二预设阈值,将所述多个行为内容合并为所述特征行为内容,所述特征行为内容对应的交易次数为所述多个行为内容的个数,所述特征行为内容为所述多个行为内容中出现次数最多的行为内容;
将所述交易次数添加至所述特征行为内容中。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据所述第一待分类用户标识对应的分类场景,划分交易次数区间;
根据所述特征行为内容对应的交易次数,确定所述特征行为内容对应的交易次数区间;
将所述特征行为内容中的所述交易次数替换为所述特征行为内容对应的交易次数区间。
7.根据权利要求3所述的方法,其特征在于,所述方法还包括:
根据第二待分类用户标识对应的分类场景,划分交易金额区间;
根据第二待分类用户行为数据中行为内容对应的交易金额,确定所述行为内容对应的交易金额区间,所述第二待分类用户行为数据为所述第二待分类用户标识对应的用户行为数据;
将所述交易金额区间添加至所述行为内容中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110217143.8/1.html,转载请声明来源钻瓜专利网。