[发明专利]确定商品匹配信息的方法、系统、电子设备及存储介质在审
申请号: | 201910207462.3 | 申请日: | 2019-03-19 |
公开(公告)号: | CN111724221A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 安旭;贾宝玉 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06K9/62 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;罗朗 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 商品 匹配 信息 方法 系统 电子设备 存储 介质 | ||
本发明公开了确定商品匹配信息的方法、系统、电子设备及存储介质,每个商品包括销售属性和商品标题,待匹配的两个商品分别为第一商品和第二商品,第一商品属于第一类商品,第二商品属于第二类商品,方法包括以下步骤:构建第一模型,使用第一历史数据和第二历史数据生成训练数据集,使用所述训练数据集对所述第一模型进行训练;基于第一模型使用第一商品的销售属性和商品标题与第二商品的销售属性和商品标题交叉匹配计算得到第一商品和第二商品构成的商品对所对应的销售属性的特征向量;基于排序模型使用销售属性的特征向量计算第一商品和第二商品的匹配度。本发明通过在商品匹配过程中引入销售属性这一特征,使得商品匹配的召回率显著提升。
技术领域
本发明涉及互联网技术领域,特别涉及一种确定商品匹配信息的方法、系统、电子设备及存储介质。
背景技术
排序模型在现实中有许多应用,比如搜索引擎。搜索引擎会根据用户的输入为每个与之关联的数据打分,将这些数据按照得分由高到低排列即可得到搜索结果。同样,在商品匹配应用中,也可以基于排序算法来做匹配推荐。下面以sigmoid(一种S型函数)函数作为排序模型为例,来说明商品匹配的应用。
sigmoid函数为:
其中x为特征,θ为特征权重。
在商品匹配中,如果排序模型是上述sigmoid函数,那么此函数值就是最终匹配关系的相似度(或者称为得分),得分越高越有可能成为匹配关系,存在匹配关系的商品往往有若干共同的特征,比如有相同的品牌词、产品词、规格,价格和标题句向量的余弦相似度的差距不大等,如果将满足某个特征标记为1,不满足标记为0,显然存在更多的相同特征对于两个商品成为匹配关系更有利。采用上述特征进行商品的匹配的召回率较高,如何提升商品匹配的召回率是一个需要解决的问题。
另外,商品匹配中经常遇到特征大规模缺失的情况,如何利用已有特征来优化排序一直是一个技术难题。在实现本发明过程中,发明人发现现有技术中只能针对特征有少量缺失的情况进行优化,一般是根据其它特征找到与缺失特征的数据接近的其他数据,用其他数据在这个特征维度上的值来近似计算缺失的特征,比如可以对近似数据的相同维度的特征求平均。但是对于某个或某几个维度的特征有大量缺失值的情况则缺少有效的解决方式,这对商品匹配应用中的预测的准确性产生较大的负面影响。
发明内容
本发明要解决的技术问题是为了克服现有技术中商品匹配的召回率较高以及对于商品的某个或某几个维度的特征有大量缺失值的情况缺少有效的解决方式,对商品匹配应用中的预测效果产生较大的影响的缺陷,提供一种能够利用特征并合理处理缺失值以及对相关特征的权重进行优化进而提高商品匹配时的预测效果的确定商品匹配信息的方法、系统、电子设备及存储介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明实施例提供了一种确定商品匹配信息的方法,每个所述商品包括销售属性和商品标题,待匹配的两个所述商品分别为第一商品和第二商品,所述第一商品属于第一类商品,所述第二商品属于第二类商品,所述方法包括以下步骤:
构建第一模型,使用第一历史数据和第二历史数据生成训练数据集,使用所述训练数据集对所述第一模型进行训练;
其中,所述第一历史数据为所述第一类商品的包括销售属性和商品标题的历史数据,所述第二历史数据为所述第二类商品的包括销售属性和商品标题的历史数据;
基于所述第一模型使用所述第一商品的销售属性和商品标题与所述第二商品的销售属性和商品标题交叉匹配计算得到所述第一商品和所述第二商品构成的商品对所对应的销售属性的特征向量;
基于排序模型使用所述销售属性的特征向量计算所述第一商品和所述第二商品的匹配度。
较佳地,所述训练数据集包括若干条训练数据,每条所述训练数据包括N个特征,N为大于等于2的整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910207462.3/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置