[发明专利]资源召回方法、装置、设备及存储介质在审
申请号: | 202111556222.8 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114298182A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 张明渝 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/74;G06N20/00 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资源 召回 方法 装置 设备 存储 介质 | ||
本公开关于一种资源召回方法、装置、设备及存储介质,涉及人工智能技术领域。该方法包括:基于预训练的特征提取模型的第一子模型,获取目标资源的目标特征向量;其中,目标特征向量用于指示目标资源的第一含义和第二含义,第一含义不同于第二含义;预训练的特征提取模型使用目标资源的特征向量中与正样本匹配的特征值进行预训练;基于预训练的特征提取模型的第二子模型,获取候选资源的候选特征向量;基于目标特征向量与候选特征向量的匹配度,确定与目标资源对应的至少两个类别的召回资源;其中,一个类别的召回资源与第一含义匹配,另一个类别的召回资源与第二含义匹配。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种资源召回方法、装置、设备及存储介质。
背景技术
在机器学习领域,为了提高机器学习的学习效果,表征学习的应用越来越广泛。具体地,表征学习是一种将原始数据转换成为更容易被机器学习应用的数据的过程。例如,通过表征学习将媒体资源的原始数据映射到一个向量空间,使得媒体资源特征被压缩成该向量空间中一个较低维度的特征向量,该较低维度的特征向量能够被后续的模型应用。
然而,相关技术中的表征学习,往往不注重特征向量的多样性表达能力,导致得到的较低维度的特征向量只能表达媒体资源的一种含义。例如,对“苹果”进行表征学习时,得到的特征向量只能表达“苹果手机”这一种含义,这就导致该特征向量后续用于搜索系统或推荐系统的召回阶段时,无法为搜索系统或推荐系统召回多样性的资源,例如,无法召回除特征向量所表达的含义之外的其他资源,比如无法召回与“食用的苹果”相关的资源等,严重限制了搜索系统或推荐系统的丰富度,用户体验比较差。
发明内容
本公开提供一种资源召回方法、装置、设备及存储介质,以至少解决相关技术中无法为搜索系统或推荐系统提供多样性的召回资源,严重限制了系统的丰富度的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种资源召回方法,包括:基于预训练的特征提取模型的第一子模型,获取目标资源的目标特征向量;其中,目标特征向量用于指示目标资源的第一含义和第二含义,第一含义不同于第二含义;预训练的特征提取模型使用目标资源的特征向量中与正样本匹配的特征值进行预训练;基于预训练的特征提取模型的第二子模型,获取候选资源的候选特征向量;基于目标特征向量与候选特征向量的匹配度,确定与目标资源对应的至少两个类别的召回资源;其中,一个类别的召回资源与第一含义匹配,另一个类别的召回资源与第二含义匹配。
在一种可能的实施方式中,方法还包括:基于第二子模型,对召回资源的特征向量进行第一预设处理,得到召回特征向量;第一预设处理为将特征向量中部分维度的特征值设置为1、其他维度的特征值设置为0,部分维度的特征值大于其他维度的特征值;基于召回特征向量中特征值为1的部分维度,确定召回资源的类别标识,类别标识用于确定召回资源的显示排序。
另一种可能的实施方式中,特征提取模型的训练过程包括:获取目标资源的训练样本,训练样本包括第一正样本和负样本;基于目标资源、第一正样本和负样本对特征提取模型进行第一训练任务的训练;第一训练任务用于使得目标资源的特征向量中与第一正样本的特征向量匹配的特征值参与第一训练任务的训练;基于第一训练任务的第一损失函数,更新特征提取模型的参数;迭代执行上述步骤,在第一训练任务的第一损失函数收敛的情况下,确定特征提取模型收敛。
另一种可能的实施方式中,训练样本还包括第二正样本,第一正样本和第二正样本属于不同的类别;特征提取模型的训练过程还包括:基于目标资源、第一正样本和第二正样本对特征提取模型进行第二训练任务的训练;第二训练任务用于使得目标资源与不同类别的正样本的匹配度的差值小于第一预设阈值;基于第一训练任务的第一损失函数,更新特征提取模型的参数,包括:基于第一训练任务的第一损失函数和第二训练任务的第二损失函数,更新特征提取模型的参数;在第一训练任务的第一损失函数收敛的情况下,确定特征提取模型收敛,包括:在第一训练任务的第一损失函数和第二训练任务的第二损失函数损失收敛的情况下,确定特征提取模型收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111556222.8/2.html,转载请声明来源钻瓜专利网。