[发明专利]推荐模型的训练方法、推荐方法、装置、介质及设备在审
申请号: | 202210363890.7 | 申请日: | 2022-04-07 |
公开(公告)号: | CN114595787A | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 程纯;段石石;王军正;谭钧心;刘长伟;汪磊;朱一飞;苏杭;蒋文伟;陈荣生;孙梓涵;陆超红 | 申请(专利权)人: | 杭州网易云音乐科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/9535 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海 |
地址: | 310052 浙江省杭州市萧山区钱江世*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推荐 模型 训练 方法 装置 介质 设备 | ||
本公开说明书中提供的推荐模型的训练方法、推荐方法、装置、介质及设备,在训练过程中,通过基于对应第一对象的第一特征向量的集合聚类得到至少一第一对象类簇,以及基于对应第二对象的第二特征向量的集合聚类得到至少一第二类簇;基于第一损失函数所计算的损失更新推荐模型;第一损失部分基于当前训练样本中第一特征向量与第二特征向量所属第二类簇的类簇中心间的第一间距得到;第二损失部分基于当前训练样本中第二特征向量同第一特征向量所属第一对象类簇的类簇中心的第二间距得到。通过对两个对象的特征分别聚类,且以优化一对象特征向量到另一对象相应类簇中心的间距以替代相关技术中优化相似度损失,使低频样本也能被充分训练。
技术领域
本公开的实施方式涉及人工智能数据处理技术领域,更具体地,本公开的实施方式涉及推荐模型的训练方法、推荐方法、装置、介质及设备。
背景技术
本部分旨在为权利要求中陈述的本公开的实施方式提供背景或上下文,此处的描述不因为包括在本部分中就承认是现有技术。
随着机器学习的不断发展,各大互联网平台普遍采用基于机器学习的推荐模型来为用户提供内容推荐的服务。基于机器学习的推荐模型需要预先根据训练数据进行训练以学习到用户的偏好,因此对应各种情形的训练数据的数量足够,则得到的推荐模型区分不同情形作准确推荐的能力越强。
然而,由于长尾效应的存在,训练样本集中的样本分布存在不均衡的问题,故而低频样本无法得到充分训练,导致预测模型中得到训练样本的特征表示并不准确。
发明内容
在本上下文中,本公开的实施方式提供推荐模型的训练方法、推荐方法、装置、介质及设备。
根据本公开的第一个方面,提供一种推荐模型的训练方法,包括:获取一组训练样本,所述训练样本包括:第一对象的第一对象特征数据、第二对象的第二对象特征数据、以及标识训练样本为正样本或负样本的标签;输入所述一组训练样本至推荐模型,执行训练过程包括:基于输入的当前训练样本的第一对象特征数据映射得到第一特征向量,以及基于当前训练样本的第二对象特征数据映射得到第二特征向量;基于已得到的各第一特征向量聚类得到至少一第一对象类簇,以及基于已得到的各第二特征向量聚类得到至少一第二类簇;基于第一损失函数所计算的损失更新所述推荐模型;其中,所述第一损失函数所计算损失包括:第一损失部分和第二损失部分;所述第一损失部分基于当前训练样本中第一特征向量与第二特征向量所属第二类簇的类簇中心间的第一间距得到;所述第二损失部分基于所述当前训练样本中第二特征向量同第一特征向量所属第一对象类簇的类簇中心的第二间距得到。
根据本公开的第二个方面,提供一种推荐方法,包括:获取至少一个第一对象的第一特征数据和多个第二对象的第二特征数据;输入所述第一特征数据和第二特征数据至推荐模型,以得到所述至少一第一对象与所述多个第二对象之间的相似度;基于所述相似度对所述多个第二对象进行排序,以用于向第一对象推荐;其中,所述推荐模型由第一方面中任一项所述的训练方法训练得到。
根据本公开的第三个方面,提供一种推荐模型的训练装置,包括:训练样本获取模块,用于获取一组训练样本,所述训练样本包括:第一对象的第一对象特征数据、第二对象的第二对象特征数据、以及标识训练样本为正样本或负样本的标签;模型训练模块,用于输入所述一组训练样本至推荐模型,执行训练过程包括:基于输入的所述第一对象特征数据映射得到第一特征向量,以及基于输入的第二对象特征数据映射得到第二特征向量;基于已得到的各第一特征向量聚类得到至少一第一对象类簇,以及基于已得到的各第二特征向量聚类得到至少一第二类簇;基于第一损失函数所计算的损失更新所述推荐模型;其中,所述第一损失函数所计算损失包括:第一损失部分和第二损失部分;所述第一损失部分基于当前训练样本中第一特征向量与第二特征向量所属第二类簇的类簇中心间的第一间距得到;所述第二损失部分基于所述当前训练样本中第二特征向量同第一特征向量所属第一对象类簇的类簇中心的第二间距得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210363890.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种取精器隔离套
- 下一篇:一种分级通风卷烟及其制备方法