[发明专利]对用户分类的方法和装置有效
申请号: | 201910801660.2 | 申请日: | 2019-08-28 |
公开(公告)号: | CN110717037B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 李茜茜;王岱鑫;周俊;向彪 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q30/02;G06Q40/02;G06N3/045;G06N3/0464;G06N3/084 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 分类 方法 装置 | ||
本说明书实施例提供一种对用户分类的方法和装置。方法包括:获取目标用户安装的各应用的应用标识构成的标识集合、各应用的名字分词后的分词集合,各应用的类别标签构成的标签集合;将标识集合、分词集合和标签集合输入预先训练的神经网络模型,获取标识集合中各应用标识分别对应的第一嵌入向量,获取分词集合中各分词分别对应的第二嵌入向量,获取标签集合中各类别标签分别对应的第三嵌入向量;对各第一嵌入向量进行加权处理得到第四嵌入向量;对各第二嵌入向量进行加权处理得到第五嵌入向量;对各第三嵌入向量进行加权处理得到第六嵌入向量;根据第四嵌入向量、第五嵌入向量和第六嵌入向量,确定目标用户对应的类别。能够准确的对用户分类。
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及对用户分类的方法和装置。
背景技术
当前,在互联网服务中常常会涉及到对用户分类,根据用户的类别确定是否向该用户提供服务,或者根据用户的类别确定向该用户提供的服务等级。例如,小额贷款业务中,为了尽量减少逾期带来的资损,在向用户发放贷款前,确定该用户的类别,以便尽可能准确地预测出该用户是否存在逾期还款的风险。
现有技术中,常常通过用户的历史行为数据对用户分类,上述历史行为数据可以包括用户的购物习惯、理财习惯等,但是当无法获取用户的历史行为数据时,就无法实现对用户准确的分类。
因此,希望能有改进的方案,能够准确的对用户分类。
发明内容
本说明书一个或多个实施例描述了一种对用户分类的方法和装置,能够准确的对用户分类。
第一方面,提供了一种对用户分类的方法,方法包括:
获取目标用户在预设历史时间周期内安装的各应用的应用标识构成的标识集合、所述各应用的名字分词后得到的分词集合,和所述各应用的类别标签构成的标签集合;
将所述标识集合、所述分词集合和所述标签集合输入预先训练的神经网络模型,其中,所述神经网络模型包括嵌入层、注意力层和分类层;
在所述嵌入层,获取所述标识集合中各应用标识分别对应的第一嵌入向量,获取所述分词集合中各分词分别对应的第二嵌入向量,获取所述标签集合中各类别标签分别对应的第三嵌入向量;
在所述注意力层,根据预先确定的应用标识权重向量,确定各应用标识对应的各第一权重,并基于各第一权重对各所述第一嵌入向量进行加权处理得到第四嵌入向量;根据预先确定的分词权重向量,确定各分词对应的各第二权重,并基于各第二权重对各所述第二嵌入向量进行加权处理得到第五嵌入向量;根据预先确定的类别标签权重向量,确定各类别标签对应的各第三权重,并基于各第三权重对各所述第三嵌入向量进行加权处理得到第六嵌入向量;
在所述分类层,根据所述第四嵌入向量、所述第五嵌入向量和所述第六嵌入向量,确定所述目标用户对应的用户类别。
在一种可能的实施方式中,所述确定各应用标识对应的各第一权重,包括:
基于各所述第一嵌入向量和所述应用标识权重向量的点积,确定各第一权重。
在一种可能的实施方式中,所述各应用标识以one-hot编码的形式输入所述神经网络模型,用于根据该one-hot编码确定所述各应用标识分别对应的第一嵌入向量。
在一种可能的实施方式中,所述各分词以one-hot编码的形式输入所述神经网络模型,用于根据该one-hot编码确定所述各分词分别对应的第二嵌入向量。
在一种可能的实施方式中,所述各类别标签以one-hot编码的形式输入所述神经网络模型,用于根据该one-hot编码确定所述各类别标签分别对应的第三嵌入向量。
在一种可能的实施方式中,所述神经网络模型采用如下方式训练:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910801660.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种统一资源定位符的去重方法、装置及电子设备
- 下一篇:对象分类方法及装置