[发明专利]基于机器学习的用户分群处理方法、装置及电子终端有效
申请号: | 201910012154.5 | 申请日: | 2019-01-07 |
公开(公告)号: | CN109885597B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 孙闳绅;金戈;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/248;G06F16/28;G06F16/22 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 冯晓平 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种基于机器学习的用户分群处理方法、装置及电子终端,涉及数据处理技术领域。本发明实施例通过获取多个脱敏处理后的脱敏用户数据;然后,利用spark大数据运算平台中的决策树模型对各个脱敏用户数据进行分类处理,得到分类处理结果;从而,基于所述决策树的决策路径以及所述分类处理结果,逐层统计所述决策树模型中每个节点的类群信息;进而,根据所述决策树的决策路径以及每个决策树模型中每个节点的类群信息,生成用户数据分布树,并保存所述用户数据分布树。因此,本发明实施例提供的技术方案能够解决现有技术中人工手动对用户画像进行分群的方式,人工成本高且用户分群准确度低的问题。 | ||
搜索关键词: | 基于 机器 学习 用户 分群 处理 方法 装置 电子 终端 | ||
【主权项】:
1.一种基于机器学习的用户分群处理方法,其特征在于,所述基于机器学习的用户分群处理方法包括:获取多个脱敏处理后的脱敏用户数据,其中,所述脱敏用户数据包括用户标识以及用户标识对应的用户特征;利用spark大数据运算平台中的决策树模型对各个脱敏用户数据进行分类处理,得到分类处理结果;基于所述决策树的决策路径以及所述分类处理结果,逐层统计所述决策树模型中每个节点的类群信息,其中,所述类群信息包括用户标识数量、用户特征、各维度的用户特征的用户占比;根据所述决策树的决策路径以及每个决策树模型中每个节点的类群信息,生成用户数据分布树,并保存所述用户数据分布树。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910012154.5/,转载请声明来源钻瓜专利网。