[发明专利]商品相似度计算方法及装置、存储介质、电子设备有效
申请号: | 201710953390.8 | 申请日: | 2017-10-13 |
公开(公告)号: | CN109670161B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 朱远昌 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F40/289;G06N3/04;G06Q30/06 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 商品 相似 计算方法 装置 存储 介质 电子设备 | ||
本公开是关于一种商品相似度计算方法及装置,属于数据处理技术领域,该方法包括:利用第一机器学习模型对多个标题词进行学习得到多个与各标题词关联的分布式向量表示;利用第二机器学习模型对各分布式向量表示以及历史商品相似度进行学习得到各标题词之间的相似度;根据各标题词之间的相似度得到由各标题词组成的商品之间的相似度。该方法可以根据各标题词的分布式向量表示以及各标题词之间的相似度对新加入的商品以及销量较小的商品进行打分,从而可以使得推荐系统可以根据各新加入的商品以及销量较小的商品的分数进行推荐,可以进一步的帮助用户推荐需要的产品以提高产品的销售数量以及用户的满意度。
技术领域
本公开涉及数据处理技术领域,具体而言,涉及一种商品相似度计算方法、商品相似度计算装置、计算机可读存储介质以及电子设备。
背景技术
随着电子商务技术与物流配送体系的不断发展以及完善,网上购物也受到越来越多消费者的欢迎,与此同时,网上购物的种类也在不断拓展。在这种形势下,各个电商网站的竞争也在日益加剧;而各电商网站随之产生的推荐系统不仅有利于消费者用更少的点击和时间找到自己需要的商品,也更加有利于提高电子商务网站的销售额度以及用户满意度。
在上述电子商务网站的推荐系统中,应用较为广泛的一类算法可以包括基于商品的协同过滤算法。其中,基于商品的协同过滤算法包括一个基本的假设,例如可以是:“能够引起用户兴趣的项目,必定与其之前评分高的项目相似”;例如,用户搜索、点击或者收藏过某一款“洗发水”商品,推荐系统可以认为该用户对该款洗发水感兴趣,因此会给出比较高的评分;然后利用已经计算好的商品间相似度作为权重把该比较高的评分传递给其它商品,最后把经过传递后评分比较高的商品推荐给用户。
进一步的,在基于商品的协同过滤算法中,核心的部分可以包括商品间相似度的计算。常用的相似度计算方法可以利用用户对各个商品的评分距离(如余弦距离)来代替;但是,计算余弦距离需要大量的用户评分信息,对于销量较小的商品只有非常有限的用户评分信息,新加入的商品通常没有用户的评分信息,因此对于销量较小的商品以及新加入的商品(可以被称为冷启动商品)来说,很难通过上述方法被推荐给需要的用户。
在目前的电子商务推荐系统中,对于销量较小的商品以及新加入的商品相似度的计算方法可以包括:人工标注、基于图片的相似度计算以及基于标题的文本相似性算法。但是,利用人工标注、基于图片的相似度计算以及基于标题的文本相似性算法存在如下缺点:(1)对于新加入的商品,人工标注只能对有限个商品进行相似度标注,无法对全部商品进行相似度标注;(2)基于图片的相似度计算可以很好的处理部分品类的冷启动商品(如服装),但是无法处理某些外观相似但内部参数和价格差距较大的商品(如电脑配件);(3)部分文本相似性算法(如simhash)无法对同义词和近义词进行处理,如,有的商家在标题中用“夏装”,有的商家用“夏季”来描述同一件服装类商品;而现有的可以对同义词与近义词进行处理的文本相似性算法(如word2vec)只适用于有一定结构和顺序的自然语言,对电子商务网站中的标题不适用。
因此,需要提供一种新的商品相似度计算方法。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种商品相似度计算方法、商品相似度计算装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
根据本公开的一个方面,提供一种商品相似度计算方法,包括:
利用第一机器学习模型对多个标题词进行学习得到多个与各所述标题词关联的分布式向量表示;
利用第二机器学习模型对各所述分布式向量表示以及历史商品相似度进行学习得到各标题词之间的相似度;
根据各所述标题词之间的相似度得到由各所述标题词组成的商品之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710953390.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分综丝机
- 下一篇:用于涂布装置的可调滚压结构