[发明专利]处理用户行为序列的方法、装置、设备和存储介质在审
申请号: | 202310157414.4 | 申请日: | 2023-02-20 |
公开(公告)号: | CN116304733A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 赵世玮;夏铭轩;吴润泽;严晗;戚家恒;沈旭东;李乐;吕唐杰;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
主分类号: | G06F18/22 | 分类号: | G06F18/22;G06F18/214;G06N3/04;G06N3/0455;G06N3/09;G06N3/088 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁 |
地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理 用户 行为 序列 方法 装置 设备 存储 介质 | ||
1.一种处理用户行为序列的方法,其特征在于,所述方法包括:
获取第一训练样本集,其中,所述第一训练样本集包括:根据行为序列数据集生成的对比学习任务的正样本对和负样本对;所述行为序列数据集包括多个用户行为序列;
利用所述第一训练样本集对神经网络模型执行第一训练,获得初始相似度分析模型,其中,所述第一训练过程包括:根据所述对比学习任务的正样本对和负样本对,对所述神经网络模型执行所述第一训练,获得所述初始相似度分析模型;
利用第二训练样本集对所述初始相似度分析模型执行第二训练,获得相似度分析模型,其中,所述第二训练样本集包括:训练样本和训练标签,所述训练样本包括所述多个用户行为序列中的部分用户行为序列中的任意两个用户行为序列,所述训练标签表示所述部分用户行为序列中的任意两个用户行为序列是否相似;所述相似度分析模型用于确定不同用户行为序列之间是否相似。
2.根据权利要求1所述的方法,其特征在于,所述多个用户行为序列中的每个用户行为序列包括所述每个用户在多个时刻分别对应的多个行为数据,所述多个用户行为序列包括的每个用户行为序列对应至少两个增强序列,且所述每个用户行为序列对应的至少两个增强序列是对所述每个用户行为序列分别执行至少两种不同的数据增强处理所获得的序列,
其中,所述获取第一训练样本集,包括:
针对同一用户行为序列之间的对比学习任务,将所述同一用户行为序列对应的至少两个增强序列中时刻相同的行为数据构成所述对比学习任务的正样本对,以及将所述同一用户行为序列对应的至少两个增强序列中时刻不同的行为数据构成第一类型的负样本对,其中,所述同一用户行为序列为所述多个用户行为序列中的任意一个用户行为序列,所述对比学习任务的负样本对包括所述第一类型的负样本对;
针对不同用户行为序列之间的对比学习任务,将第一用户行为序列对应的至少两个增强序列中的任意一个增强序列和第二用户行为序列对应的至少两个增强序列中的任意一个增强序列中时刻相同的行为数据构成第二类型的负样本对,其中,所述多个用户行为序列包括所述第一用户行为序列和所述第二用户行为序列,所述对比学习任务的负样本对还包括所述第二类型的负样本对。
3.根据权利要求2所述的方法,其特征在于,在所述获取第一训练样本集之前,所述方法还包括:
对所述多个用户行为序列包括的每个行为序列执行所述至少两种不同的数据增强处理,获得所述每个行为序列对应的至少两种增强序列。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述利用所述第一训练样本集对神经网络模型执行第一训练,获得初始相似度分析模型,包括:
利用所述神经网络模型对所述对比学习任务的正样本对和负样本对进行处理,获得所述对比学习任务的正样本对的特征向量和所述负样本对的特征向量;
根据所述对比学习任务的正样本对的特征向量和所述负样本对的特征向量,确定所述对比学习任务的对比损失;
根据所述对比损失对所述神经网络模型的参数进行调整;
待训练达到第一预设训练条件时,停止对所述神经网络模型的参数进行调整,获得所述初始相似度分析模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310157414.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可减小汽车座椅震动幅度的谐振器
- 下一篇:一种话筒放大器电路及音频设备