[发明专利]信息处理方法、装置、电子设备及计算机存储介质在审
申请号: | 201911277071.5 | 申请日: | 2019-12-12 |
公开(公告)号: | CN112989177A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 王跃 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9537 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰;张美洁 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 电子设备 计算机 存储 介质 | ||
1.一种信息处理方法,包括:
将与输入的搜索信息对应的搜索词向量,以及搜索辅助向量输入搜索模型,其中,所述搜索辅助向量包括以下至少之一:输入所述搜索信息的用户的用户信息对应的用户向量、输入所述搜索信息时的时空信息对应的时空向量;
基于所述搜索模型对所述搜索词向量和所述搜索辅助向量进行特征提取的结果,输出与所述搜索信息相关联的关联搜索信息。
2.根据权利要求1所述的方法,其中,所述基于所述搜索模型对所述搜索词向量和所述搜索辅助向量进行特征提取的结果,输出与所述搜索信息相关联的关联搜索信息,包括:
通过所述搜索模型对所述搜索词向量进行第一特征提取,获得对应的搜索特征向量;
对所述搜索特征向量和所述搜索辅助向量进行向量拼接,获得拼接向量;
基于所述拼接向量进行第二特征提取,获得特征提取的结果;
基于所述特征提取的结果输出与所述搜索信息相关联的关联搜索信息。
3.根据权利要求1或2所述的方法,其中,在所述将与输入的搜索信息对应的搜索词向量,以及搜索辅助向量输入搜索模型之前,所述方法还包括:
使用搜索样本集,对所述搜索模型进行训练,其中,所述搜索样本集包括:搜索输入样本、与所述搜索输入样本关联的标题样本;
其中,所述标题样本用于指示当前搜索操作之前的搜索操作对应的搜索结果中,被所述用户操作的搜索结果的结果标题;所述当前搜索操作为使用所述搜索输入样本进行的搜索操作。
4.根据权利要求3所述的方法,其中,所述搜索样本集中还包括搜索辅助样本信息,所述搜索辅助样本信息包括以下至少之一:所述搜索输入样本对应的用户样本信息、所述搜索输入样本对应的时空样本信息。
5.根据权利要求4所述的方法,其中,所述搜索模型包括输入层、隐含层和输出层;
当所述搜索样本集中还包括所述搜索辅助样本信息时:
所述输入层用于接收输入的所述搜索输入样本对应的第一词向量、所述标题样本对应的第二词向量、和所述搜索辅助样本信息对应的第三向量;
所述隐含层用于对所述第一词向量和所述第二词向量分别进行第一特征提取,获得对应的第一特征向量和第二特征向量;对所述第一特征向量、所述第二特征向量和所述第三向量进行向量拼接,获得拼接向量;并对所述拼接向量进行第二特征提取,输出特征提取的结果;
所述输出层包括第一输出层和第二输出层,所述第一输出层用于根据所述特征提取的结果对输入的第一词向量进行调整,所述第二输出层用于根据所述特征提取的结果输出关联搜索样本。
6.根据权利要求5所述的方法,其中,所述第一输出层用于根据所述特征提取的结果及输入的推荐样本进行损失计算,并根据计算结果对输入的第一词向量进行调整。
7.根据权利要求5所述的方法,其中,所述第二输出层用于将所述特征提取的结果与输入的推荐样本进行相似度计算,根据计算结果输出关联搜索样本。
8.根据权利要求6或7所述的方法,其中,所述推荐样本包括正推荐样本和负推荐样本,所述正推荐样本表示基于所述搜索输入样本向用户推荐的搜索样本且被所述用户点击的样本;所述负推荐样本表示基于所述搜索输入样本向用户推荐的搜索样本且未被所述用户点击的样本。
9.根据权利要求8所述的方法,其中,所述推荐样本中,所述负推荐样本的数量大于所述正推荐样本。
10.根据权利要求9所述的方法,其中,所述负推荐样本与所述正推荐样本的数量配比满足预设配比阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911277071.5/1.html,转载请声明来源钻瓜专利网。