[发明专利]搜索推荐模型的训练方法、搜索结果排序的方法及装置在审
申请号: | 202010424719.3 | 申请日: | 2020-05-19 |
公开(公告)号: | CN113688304A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 蔡国豪;王刚;董振华;李小光;何秀强;祝宏 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王龙华;王君 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 推荐 模型 训练 方法 结果 排序 装置 | ||
1.一种搜索推荐模型的训练方法,其特征在于,包括:
获取训练样本集合,其中,所述训练样本集合中包括样本用户行为组序列与样本遮盖用户行为组序列,所述样本用户行为组序列中包括第一查询字段以及所述第一查询字段对应的搜索结果中样本用户的响应操作的对象,所述样本遮盖用户行为组序列包括第二查询字段以及对所述第二查询字段对应的搜索结果中所述样本用户的响应操作的对象进行遮盖处理后得到的序列;
通过以所述训练样本集合为输入数据,以得到遮盖处理的所述样本用户响应操作的对象为训练目标对搜索推荐模型进行训练,得到训练后的搜索推荐模型,其中,所述搜索推荐模型用于在目标用户输入查询字段的情况下,预测所述查询字段对应的搜索结果中的候选推荐对象的标签,所述标签用于表示所述目标用户对所述候选推荐对象进行响应操作的概率。
2.如权利要求1所述的训练方法,其特征在于,所述搜索推荐模型是基于所述目标用户输入查询字段与所述目标用户的历史行为组序列预测所述候选推荐对象的标签,所述目标用户的历史行为组序列是基于所述目标用户的历史查询字段,以及对应于所述历史查询字段的历史行为数据得到的,所述对应于所述历史查询字段的历史行为数据是所述目标用户对所述历史查询字段对应的搜索结果的响应操作的对象。
3.如权利要求1或2所述的训练方法,其特征在于,所述样本用户行为组序列还包括标识信息,所述标识信息用于表示所述第一查询字段与所述样本用户的响应操作的对象之间的关联关系,所述标识信息包括时间标识。
4.如权利要求1至3中任一项所述的训练方法,其特征在于,所述搜索推荐模型为双向编码表示变换BERT模型,还包括:
对所述样本用户行为组序列与所述样本遮盖用户行为组序列进行向量化处理得到向量序列;
所述通过以所述训练样本集合为输入数据,包括:
将所述向量序列输入至所述BERT模型。
5.如权利要求1至4中任一项所述的训练方法,其特征在于,所述样本用户的响应操作包括所述样本用户的点击操作、下载操作、购买操作以及浏览操作中的一项或者多项。
6.一种搜索结果排序的方法,其特征在于,包括:
获取用户的待处理用户行为组序列,其中,所述待处理用户行为组序列包括所述用户的当前查询字段以及对所述用户的响应操作的对象进行遮盖处理后得到的序列;
将所述待处理行为组序列输入至预先训练的搜索推荐模型,得到所述当前查询字段对应的候选推荐对象集合中的候选推荐对象的标签,所述标签用于表示所述用户对候选推荐对象集合中的候选推荐对象进行响应操作的概率;
根据所述候选推荐对象的标签得到所述当前查询字段对应的搜索排序结果,
其中,所述搜索推荐模型用于在目标用户输入查询字段的情况下,预测所述查询字段对应的搜索结果中的候选推荐对象的标签,所述搜索推荐模型是通过以训练样本集合为输入数据,以得到遮盖处理的样本用户响应操作的对象为训练目标进行训练得到的,所述训练样本集合中包括样本用户行为组序列与样本遮盖用户行为组序列,所述样本用户行为组序列中包括第一查询字段以及所述第一查询字段对应的搜索结果中样本用户的响应操作的对象,所述样本遮盖用户行为组序列包括第二查询字段以及对所述第二查询字段对应的搜索结果中所述样本用户的响应操作的对象进行遮盖处理后得到的序列。
7.如权利要求6所述的方法,其特征在于,所述搜索推荐模型是基于所述目标用户输入查询字段与所述目标用户的历史行为组序列预测所述候选推荐对象的标签,所述目标用户的历史行为组序列是基于所述目标用户的历史查询字段,以及对应于所述历史查询字段的历史行为数据得到的,所述对应于所述历史查询字段的历史行为数据是所述目标用户对所述历史查询字段对应的搜索结果的响应操作的对象。
8.如权利要求6或7所述的方法,其特征在于,所述样本用户行为组序列还包括标识信息,所述标识信息用于表示所述第一查询字段与所述样本用户的响应操作的对象之间的关联关系,所述标识信息包括时间标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010424719.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型凸轮箱
- 下一篇:一种多级的食用油加工用原料筛选装置