[发明专利]用户判别模型训练方法、用户判别方法及相关装置有效
申请号: | 202111555671.0 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114241264B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 邓小明 | 申请(专利权)人: | 深圳尚米网络技术有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06K9/62;G06N3/04;G06N3/08;G06F16/953 |
代理公司: | 深圳中细软知识产权代理有限公司 44528 | 代理人: | 袁文英 |
地址: | 518000 广东省深圳市宝安区新安街道兴*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 判别 模型 训练 方法 相关 装置 | ||
1.一种用户判别模型训练方法,其特征在于,所述用户判别模型包括行为特征提取模块和判别模块,所述方法包括:
获取训练样本集,所述训练样本集包括多个训练样本的样本信息和样本标签,其中,一个训练样本的样本信息包括一个用户对应的行为编码,所述行为编码用于指示所述一个用户在预设时间周期内的网页浏览行为,一个样本标签用于指示一个用户是否属于预设行为用户,所述预设行为用户是指进行与预设类型的网页相关联的行为的用户;
从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本,并将所述目标训练样本、所述正参考样本和所述负参考样本各自的样本信息分别输入至所述行为特征提取模块,以得到所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征;其中,所述目标训练样本为所述训练样本集中的任意一个训练样本,所述正参考样本的样本标签与所述目标训练样本的样本标签相同,所述负参考样本的样本标签与所述目标训练样本的样本标签不同;
将所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征分别输入至所述判别模块,以获取所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果,一个判别结果用于指示一个训练样本对应的用户是否属于所述预设行为用户;
根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征,以及,所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果,以及,所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签,对所述用户判别模型进行调参,返回执行所述从所述训练样本集中选取目标训练样本、所述目标训练样本的正参考样本和所述目标训练样本的负参考样本的步骤,直至所述用户判别模型收敛,将收敛后的用户判别模型确定为目标用户判别模型;
所述根据所述目标训练样本、所述正参考样本和所述负参考样本各自对应的行为特征,以及,所述目标训练样本、所述正参考样本和所述负参考样本各自对应的判别结果,以及,所述目标训练样本、所述正参考样本和所述负参考样本各自的样本标签,对所述用户判别模型进行调参,具体包括:
根据所述目标训练样本对应的行为特征与所述正参考样本对应的行为特征之间的差距,以及,所述目标训练样本对应的行为特征与所述负参考样本对应的行为特征之间的差距,计算特征提取损失,所述特征提取损失用于指示所述用户判别模型进行特征提取的精准度;
根据所述目标训练样本对应的判别结果与所述目标训练样本的样本标签之间的差距、所述正参考样本对应的判别结果与所述正参考样本的样本标签之间的差距,以及,所述负参考样本对应的判别结果与所述负参考样本的样本标签之间的差距,计算判别损失,所述判别损失用于指示用户判别模型进行判别的精准度;
根据所述特征提取损失和所述判别损失,得到所述用户判别模型的损失;
根据所述用户判别模型的损失,对所述用户判别模型进行调参。
2.根据权利要求1所述的方法,其特征在于;所述获取训练样本集,包括:
获取第一用户在所述预设时间周期内的网页浏览行为数据,所述第一用户为任一用户,所述网页浏览行为数据包括第一行为对应的行为时间数据、第二行为对应的行为时间数据和/或第三行为对应的行为时间数据,所述第一行为是指浏览所述预设类型的网页,所述第二行为是指浏览除所述预设类型以外的网页,所述第三行为是指未浏览网页;
按预设划分频率,将所述预设时间周期划分为多个时间片段;
对所述第一用户在各时间片段内的网页浏览行为数据进行编码,以得到所述第一用户对应的行为编码。
3.根据权利要求2所述的方法,其特征在于,所述对所述第一用户在各时间片段内的网页浏览行为数据进行编码,以得到所述第一用户对应的行为编码,包括:
若目标时间片段中第一用户进行目标行为的时长大于预设时间阈值,则将所述目标时间片段内的网页浏览行为数据编码为所述目标行为对应的行为编码,所述目标时间片段为所述多个时间片段中的任一时间片段,所述目标行为为所述第一行为、所述第二行为或所述第三行为。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳尚米网络技术有限公司,未经深圳尚米网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111555671.0/1.html,转载请声明来源钻瓜专利网。