[发明专利]商品相似度计算方法及装置、存储介质、电子设备有效
申请号: | 201710953390.8 | 申请日: | 2017-10-13 |
公开(公告)号: | CN109670161B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 朱远昌 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F40/289;G06N3/04;G06Q30/06 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 相似 计算方法 装置 存储 介质 电子设备 | ||
1.一种商品相似度计算方法,其特征在于,包括:
利用第一机器学习模型对多个标题词进行学习得到多个与各所述标题词关联的分布式向量表示;
利用第二机器学习模型对各所述分布式向量表示以及历史商品相似度进行学习得到各标题词之间的相似度;
根据各所述标题词之间的相似度得到由各所述标题词组成的商品之间的相似度。
2.根据权利要求1所述的商品相似度计算方法,其特征在于,所述第一机器学习模型包括嵌入层、全连接层以及Softmax层。
3.根据权利要求2所述的商品相似度计算方法,其特征在于,利用第一机器学习模型对多个标题词进行学习得到多个与各所述标题词关联的分布式向量表示包括:
利用所述嵌入层对各所述标题词进行学习得到所述分布式向量表示的第一向量规模;
利用所述全连接层以及所述Softmax层对各所述标题词进行学习得到所述分布式向量表示的第二向量规模;
将所述第一向量规模以及第二向量规模进行拼接得到与各所述标题词关联的分布式向量表示。
4.根据权利要求3所述的商品相似度计算方法,其特征在于,所述全连接层包括:
full=W1x1+b;
其中,W1为全连接层的待优化矩阵;b为全连接层的待优化变量;full为全连接层的输出;x1为全连接层的输入。
5.根据权利要求3所述的商品相似度计算方法,其特征在于,所述Softmax层包括:
;
x2为Softmax层的输入;w2为Softmax层的待优化矩阵;neg sample表示负样本集;possample表示正样本集;P(y=j|x2)表示当x2输入为时,输出为j的概率;j表示输出的类别;x2T表示x2的转置。
6.根据权利要求1所述的商品相似度计算方法,其特征在于,所述第二机器学习模型包括多个卷积层、激活层、池化层、全连接层以及逻辑回归层。
7.根据权利要求6所述的商品相似度计算方法,其特征在于,利用第二机器学习模型对各所述分布式向量表示以及历史商品相似度进行学习得到各标题词之间的相似度包括:
利用激活层计算各所述分布式向量表示间的余弦距离;
利用所述池化层计算各所述分布式向量表示间的余弦距离与所述历史商品相似度间的闵可夫斯基距离;
根据各所述闵可夫斯基距离得到各所述标题词之间的相似度。
8.根据权利要求1-7任一项所述的商品相似度计算方法,其特征在于,所述第一机器学习模型为神经网络模型。
9.一种商品相似度计算装置,其特征在于,包括:
第一学习模块,用于利用第一机器学习模型对多个标题词进行学习得到多个与各所述标题词关联的分布式向量表示;
第二学习模块,用于利用第二机器学习模型对各所述分布式向量表示以及历史商品相似度进行学习得到各标题词之间的相似度;
相似度模块,用于根据各所述标题词之间的相似度得到由各所述标题词组成的商品之间的相似度。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8任一项所述的商品相似度计算方法。
11.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-8任一项所述的商品相似度计算方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710953390.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:分综丝机
- 下一篇:用于涂布装置的可调滚压结构