[发明专利]确定用户标签的方法、自编码网络的训练方法及装置有效
申请号: | 201910025949.X | 申请日: | 2019-01-11 |
公开(公告)号: | CN109753608B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 胡彬 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N99/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘;李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 用户 标签 方法 编码 网络 训练 装置 | ||
1.一种确定用户标签的方法,其特征在于,包括:
获取待识别用户的特征数据;
采用自编码网络中的编码层对所述待识别用户的特征数据进行编码,确定所述待识别用户的嵌入特征,所述自编码网络是以用户特征数据以及用户标签为训练样本训练获得,所述自编码网络的损失函数至少是基于相似度损失函数确定的;
根据所述待识别用户的嵌入特征确定所述待识别用户的用户标签;
所述相似度损失函数是根据输入所述编码层的训练样本的用户特征数据和所述编码层输出的训练样本的嵌入特征确定的,具体包括:
针对输入编码层的任意两个训练样本,根据所述两个训练样本的用户特征数据确定所述两个训练样本的原始特征;
确定所述两个训练样本的原始特征的第一相似度;
确定所述编码层输出的所述两个训练样本的嵌入特征的第二相似度;
根据所述第一相似度和所述第二相似度确定所述自编码网络的相似度损失函数。
2.如权利要求1所述的方法,其特征在于,所述根据所述待识别用户的嵌入特征确定所述待识别用户的用户标签,包括:
将所述待识别用户的嵌入特征与预先获取的多个样本特征进行聚类,每个样本特征预先标记用户标签;
根据与所述待识别用户的嵌入特征同属一类的样本特征的用户标签,确定所述待识别用户的用户标签。
3.如权利要求2所述的方法,其特征在于,所述根据与所述待识别用户的嵌入特征同属一类的样本特征的用户标签,确定所述待识别用户的用户标签,包括:
确定与所述待识别用户的嵌入特征同属一类的至少一个样本特征;
对所述至少一个样本特征的用户标签进行统计,确定每类用户标签的数量;
将数量最多的用户标签确定为所述待识别用户的用户标签。
4.如权利要求1所述的方法,其特征在于,所述根据所述待识别用户的嵌入特征确定所述待识别用户的用户标签,包括:
将所述待识别用户的嵌入特征输入训练好的分类器,确定所述待识别用户的用户标签。
5.一种自编码网络的训练方法,其特征在于,包括:
将训练样本输入初始的自编码网络,所述训练样本包括用户特征数据以及用户标签;
采用所述自编码网络的编码层对所述训练样本进行编码,确定所述训练样本的嵌入特征;
针对输入编码层的任意两个训练样本,根据所述两个训练样本的用户特征数据确定所述两个训练样本的原始特征;
确定所述两个训练样本的原始特征的第一相似度;以及确定所述编码层输出的所述两个训练样本的嵌入特征的第二相似度;
根据所述第一相似度和所述第二相似度确定所述自编码网络的相似度损失函数;
至少根据所述相似度损失函数确定所述自编码网络的损失函数;
在所述自编码网络的损失函数没有满足预设条件时,采用所述自编码网络的损失函数调整所述自编码网络的参数,并采用调整后的自编码网络对所述训练样本进行编码,确定所述训练样本的嵌入特征;依次循环,直到所述自编码网络的损失函数满足所述预设条件时,训练结束。
6.如权利要求5所述的方法,其特征在于,还包括:
采用所述自编码网络的解码层对所述训练样本的嵌入特征进行解码,确定所述训练样本的自编码结果;
根据所述训练样本和所述训练样本的自编码结果确定所述自编码网络的自编码损失函数;
所述至少根据所述相似度损失函数确定所述自编码网络的损失函数,包括:
根据所述相似度损失函数和所述自编码损失函数确定所述自编码网络的损失函数。
7.如权利要求5所述的方法,其特征在于,还包括:
将所述训练样本的嵌入特征输入分类器,确定所述训练样本的用户标签预测值;
根据所述训练样本的用户标签预测值和所述训练样本的用户标签真实值确定所述自编码网络的分类损失函数;
所述至少根据所述相似度损失函数确定所述自编码网络的损失函数,包括:
根据所述相似度损失函数和所述分类损失函数确定所述自编码网络的损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910025949.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种陈列用户信息流的方法及系统
- 下一篇:一种多意图查询方法、装置以及终端