[发明专利]用户聚类及特征学习方法、设备、计算机可读介质有效
申请号: | 201911115032.5 | 申请日: | 2019-11-14 |
公开(公告)号: | CN111062416B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 李怀松;潘健民 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06Q30/06 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 王戈 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 特征 学习方法 设备 计算机 可读 介质 | ||
1.一种用户聚类及特征学习方法,其中,该方法包括:
获取用户的交易行为数据,并根据所述交易行为数据确定各个用户的交易行为序列,所述交易行为序列中的序列元素用于表示所述用户在一个时间窗口内的交易行为数据;其中,所述交易行为序列是基于用户的交易行为数据进行数据处理后,按照预设形式所呈现的数据内容;
基于深度学习网络的编码器,将各个用户的交易行为序列进行编码,生成深度特征;其中,对用户的交易行为序列进行位置编码,确定序列元素在交易行为序列中的相对位置信息;将携带有相对位置信息的交易行为序列,输入采用多头注意力机制的深度学习网络的编码器,获得深度特征;
基于深度学习网络的解码器,对所述深度特征进行解码,获得还原的交易行为序列,并根据所述深度特征对用户进行聚类,获取聚类结果;其中,将深度特征输入采用多头注意力机制的深度学习网络的解码器,获得还原的交易行为序列中的首个序列元素;将深度特征输入和前一次解码获得的序列元素,输入采用多头注意力机制的深度学习网络的解码器,还原的交易行为序列中的后续序列元素;
根据所述深度学习网络的损失函数和聚类的目标函数确定学习目标,所述深度学习网络的损失函数根据还原的交易行为序列与原始的交易行为序列之间的差异信息确定,所述聚类的目标函数根据所述聚类结果确定;
根据所述学习目标对所述深度学习网络的编码器和解码器的参数进行迭代调整,以使所述学习目标符合预设条件;将学习目标符合预设条件时所获得的聚类结果以及深度特征,作为输出内容。
2.根据权利要求1所述的方法,其中,对用户的交易行为序列进行位置编码,确定序列元素在交易行为序列中的相对位置信息,包括:
根据序列元素在交易行为序列中的排序位置和元素序列的维度,确定序列元素在交易行为序列中的相对位置信息。
3.根据权利要求1所述的方法,其中,所述交易行为数据包括在多个时间窗口所对应的多项交易行为信息。
4.根据权利要求1所述的方法,其中,所述深度学习网络的损失函数为还原的交易行为序列与原始的交易行为序列的平方差。
5.根据权利要求1所述的方法,其中,所述聚类的目标函数为聚类结果中各个类别对应的深度特征的标准差之和。
6.根据权利要求1所述的方法,其中,根据所述深度特征对用户进行聚类,获取聚类结果,包括:
采用基于层次密度的噪声应用空间聚类算法,根据所述深度特征对用户进行聚类,获取聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911115032.5/1.html,转载请声明来源钻瓜专利网。