[发明专利]去除位置偏置的模型训练方法、介质、装置和计算设备在审
申请号: | 202210004719.7 | 申请日: | 2022-01-04 |
公开(公告)号: | CN114357304A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 章莺;肖强;李勇 | 申请(专利权)人: | 杭州网易云音乐科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62;G06N3/04 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;黄健 |
地址: | 310052 浙江省杭州市萧山区钱江世*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 去除 位置 偏置 模型 训练 方法 介质 装置 计算 设备 | ||
本公开的实施方式提供了一种去除位置偏置的模型训练方法、介质、装置和计算设备,对于点击任务或完播任务中的任一种任务,在模型的训练过程中,基于主模型,根据任务中样本对象的用户特征、对象特征,获得所述任务对应的拟预测值;同时,基于第一从模型,通过样本对象的对象位置特征,获得样本对象对应的位置影响力值;再通过获取的位置影响力值对主模型和从模型进行迭代训练,使得训练得到的主模型可以去除位置偏置,从而在通过主模型进行对象推荐时,可以消除对象所在位置对推荐结果的影响,获得潜在的用户真正感兴趣的对象,从而提升用户的满意度,进而提升平台的推荐转化率。
技术领域
本公开的实施方式涉及信息处理技术领域,更具体地,本公开的实施方式涉及一种去除位置偏置的模型训练方法、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着互联网产品的不断发展,为了给用户提供个性化推荐服务,达到“千人千面”的个性化体验,推荐系统应运而生。
推荐系统的核心是所推荐对象的转化概率预估,把认为可能对用户转化率较高的对象推荐给用户。例如,对于一些流媒体平台,例如音乐平台、影视剧平台和文学作品阅读平台等平台中,若这些平台的推荐系统能准确向用户推荐更符合用户需求的对象,例如歌曲、影视剧或者文学作品等,就意味着这些对象能更高效地被用户吸收,从而最大化平台和用户的利益,同时保障用户体验。
然而,对象在推荐页面中的位置等因素均会影响用户的选择,而目前的推荐系统通常是根据用户的偏好进行推荐,这就导致平台推荐的对象很难满足用户需求。
发明内容
在本上下文中,本公开的实施方式期望提供一种去除位置偏置的模型训练方法、介质、装置和计算设备。
在本公开实施方式的第一方面中,提供了一种去除位置偏置的模型训练方法,包括:对于点击任务或完播任务中的任一种任务,获取任务中样本对象的第一用户特征、对象特征,将第一用户特征、对象特征输入主模型,获得任务对应的拟预测值;获取样本对象的对象位置特征和第二用户特征,将对象位置特征和第二用户特征输入第一从模型,获得位置影响力值,位置影响力值用于表征对象的展示位置对任务的影响力大小;根据拟预测值和位置影响力值,确定任务对应的第一预测值;根据第一预测值、样本的第一真实标签和第一损失函数,对主模型和第一从模型进行迭代训练,直到满足训练退出条件,获得目标主模型。
在本公开的一个实施例中,对象位置特征包括:对象在第一区域中的第一位置特征和第一区域在所有区域中的第二位置特征;
将对象位置特征和第二用户特征输入第一从模型,获得位置影响力值,包括:获取第一位置特征对应的第一独热向量;根据第一独热向量,查找到第一独热向量对应的第一稠密向量;获取第二位置特征对应的第二独热向量;根据第二独热向量,查找第二独热向量对应的第二稠密向量;获取第二用户特征对应的第一从用户向量;根据第一从用户向量和预设稠密矩阵,得到第三稠密向量;将第一稠密向量、第二稠密向量和第三稠密向量输入第一从模型的拼接层进行拼接,得到第一拼接向量;将第一拼接向量输入第一从模型的全连接层,经过预设非线性函数获得位置影响力值。
在本公开的一个实施例中,当任务为完播任务时,模型训练方法还包括:将对象位置特征输入第二从模型,获得选择概率值,选择概率值用于表征用户主动选择对象的概率;根据第一预测值和选择概率值,确定完播任务对应的第二预测值;根据第二预测值、样本的第二真实标签和第二损失函数,对主模型、第一从模型和第二从模型进行迭代训练,直到满足训练退出条件,获得目标主模型。
在本公开的一个实施例中,将对象位置特征输入第二从模型,获得选择概率值,包括:将第一稠密向量和第二稠密向量输入到第二从模型的拼接层进行拼接,得到第二拼接向量;将第二拼接向量输入第二从模型的全连接层,经过预设非线性函数获得选择概率值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210004719.7/2.html,转载请声明来源钻瓜专利网。