[发明专利]用户聚类及特征学习方法、设备、计算机可读介质有效
申请号: | 201911115032.5 | 申请日: | 2019-11-14 |
公开(公告)号: | CN111062416B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 李怀松;潘健民 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06Q30/06 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 王戈 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 特征 学习方法 设备 计算机 可读 介质 | ||
本申请提供了一种用户聚类及特征学习方案,结合了聚类算法和深度学习网络中的编码解码模型,可以先基于用户的交易行为数据确定用户的交易行为序列,而后基于深度学习网络的编码器,将各个用户的交易行为序列进行编码,生成深度特征;在根据所述深度特征对用户进行聚类获取聚类结果的同时,基于深度学习网络的解码器,对所述深度特征进行解码,获得还原的交易行为序列;而后根据聚类结果和解码结果确定学习目标,并根据学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整,由此在完成聚类的同时,能够优化深度学习网络,以获得更好的、用于实现聚类的深度特征。
技术领域
本申请涉及信息技术领域,尤其涉及一种用户聚类及特征学习方法、 设备、计算机可读介质。
背景技术
随着互联网技术以及电子商务的发展,涌现了大量的电商平台,给消 费者带来了便利。而电商平台中接入的用户数量也越来越多,虽然其中正 常用户的数量一般占绝大多数,但其中也会隐藏一些实施非法行为的用户, 此类用户会给电商平台以及使用电商平台的消费者带来风险。
为了能够识别出此类用户,目前常用的方式是使用聚类算法对所有用 户进行划分,根据聚类结果了解风险客户的分布。而目前常用的聚类算法, 如k均值聚类算法(K_means)、基于密度的噪声应用空间聚类算法(DBscan) 等,虽然在一定数据集上有较好的表现,但是使用的聚类特征大都依赖人 工的经验形成的,在数据集发生变化后其性能会显著降低,需要再次通过 人工的方式重新确定聚类特征。
本申请的一个目的是提供一种用户聚类及特征学习的方案,用以解决现 有方案中无法在聚类的同时快速获得用于聚类的特征的问题。
本申请实施例提供了一种用户聚类及特征学习方法,该方法包括:
获取用户的交易行为数据,并根据所述交易行为数据确定各个用户的 交易行为序列,所述交易行为序列中的序列元素用于表示所述用户在一个 时间窗口内的交易行为数据;
基于深度学习网络的编码器,将各个用户的交易行为序列进行编码, 生成深度特征;
基于深度学习网络的解码器,对所述深度特征进行解码,获得还原的 交易行为序列,并根据所述深度特征对用户进行聚类,获取聚类结果;
根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标, 所述深度学习网络的损失函数根据还原的交易行为序列与原始的交易行 为序列之间的差异信息确定,所述聚类的目标函数根据所述聚类结果确定;
根据所述学习目标对所述深度学习网络的编码器和解码器的参数进 行迭代调整,以使所述学习目标符合预设条件。
本申请实施例还提供了一种用户聚类及特征学习设备,该设备包括:
数据获取模块,用于获取用户的交易行为数据,并根据所述交易行为 数据确定各个用户的交易行为序列,所述交易行为序列中的序列元素用于 表示所述用户在一个时间窗口内的交易行为数据;
深度学习模块,用于基于深度学习网络的编码器,将各个用户的交易 行为序列进行编码,生成深度特征;以及基于深度学习网络的解码器,对 所述深度特征进行解码,获得还原的交易行为序列;
聚类模块,用于根据所述深度特征对用户进行聚类,获取聚类结果;
迭代处理模块,用于根据所述深度学习网络的损失函数和聚类的目标 函数确定学习目标,所述深度学习网络的损失函数根据还原的交易行为序 列与原始的交易行为序列之间的差异信息确定,所述聚类的目标函数根据 所述聚类结果确定;以及根据所述学习目标对所述深度学习网络的编码器 和解码器的参数进行迭代调整,以使所述学习目标符合预设条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911115032.5/2.html,转载请声明来源钻瓜专利网。