[发明专利]确定用户标签的方法、自编码网络的训练方法及装置有效
申请号: | 201910025949.X | 申请日: | 2019-01-11 |
公开(公告)号: | CN109753608B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 胡彬 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N99/00 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘;李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例提供了一种确定用户标签的方法、自编码网络的训练方法及装置,涉及机器学习技术领域,该方法包括:获取待识别用户的特征数据,然后采用自编码网络中的编码层对待识别用户的特征数据进行编码,确定待识别用户的嵌入特征,自编码网络的损失函数至少是基于相似度损失函数确定的,相似度损失函数是根据输入编码层的训练样本的用户特征数据和编码层输出的训练样本的嵌入特征确定的。之后再根据待识别用户的嵌入特征确定待识别用户的用户标签。由于采用不含有用户标签的用户特征数据与编码层输出的嵌入特征之间的关系来约束自编码网络的收敛方向,从而减少了噪声标签对编码层输出的嵌入特征的影响,提高基于嵌入特征预测用户标签的精度。 | ||
搜索关键词: | 确定 用户 标签 方法 编码 网络 训练 装置 | ||
【主权项】:
1.一种确定用户标签的方法,其特征在于,包括:获取待识别用户的特征数据;采用自编码网络中的编码层对所述待识别用户的特征数据进行编码,确定所述待识别用户的嵌入特征,所述自编码网络是以用户特征数据以及用户标签为训练样本训练获得,所述自编码网络的损失函数至少是基于相似度损失函数确定的,所述相似度损失函数是根据输入所述编码层的训练样本的用户特征数据和所述编码层输出的训练样本的嵌入特征确定的;根据所述待识别用户的嵌入特征确定所述待识别用户的用户标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910025949.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种陈列用户信息流的方法及系统
- 下一篇:一种多意图查询方法、装置以及终端