[发明专利]分层排序方法、计算设备和计算机可读存储介质有效
申请号: | 202011309163.X | 申请日: | 2020-11-20 |
公开(公告)号: | CN112131491B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 陈赵阳;杨涵;郑学坤 | 申请(专利权)人: | 震坤行网络技术(南京)有限公司;震坤行工业超市(上海)有限公司 |
主分类号: | G06F16/9538 | 分类号: | G06F16/9538;G06Q30/06;G06N20/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 210000 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分层 排序 方法 计算 设备 计算机 可读 存储 介质 | ||
本公开提供了一种分层排序方法、计算设备和计算机可读存储介质。该方法包括:基于多个用户的行为数据和商品类目数据构建样本集合;基于该样本集合训练相关性模型以产生训练后的相关性模型;将多个召回商品数据分为第一相关组和第一不相关组;对该第一相关组和该第一不相关组中的召回商品数据分别进行重新排序以产生第二相关组和第二不相关组;以及基于该特定用户的多个历史行为数据和梯度排序模型,对该第二相关组中的至少一部分召回商品数据进行重新排序以产生第三相关组。本发明通过结合搜索结果的相关性与用户的个性化,提高了搜索结果的排序与用户的匹配性。
技术领域
本发明概括而言涉及机器学习领域,更具体地,涉及一种分层排序方法、计算设备和计算机可读存储介质。
背景技术
随着网络的不断发展,越来越多的用户通过电商搜索系统满足购物需求。通常情况下电商搜索系统根据用户输入的搜索词能够得到成千上万相匹配的商品,但是在实际情况中,用户通常只倾向于浏览前若干项结果,即曝光的位置有限。因此,如何使得与用户需求最匹配的商品显示在有限的头部曝光位置是搜索排序需要考虑的问题。
与用户需求最匹配的商品不仅应当与用户输入的搜索词最相关,而且应当与用户的个人偏好最相关。例如,以“电脑”作为召回词进行搜索时,电商搜索系统的召回结果可能不仅包括“台式电脑”和“笔记本电脑”类目的商品,还可能包括诸如“电脑显示器”、“电脑数据线”等类目的商品。而根据实际经验,“台式电脑”和“笔记本电脑”类目的商品与用户的召回词“电脑”的相关性可能更高。
此外,对于不同用户来说,同一召回词的情况下与用户需求最匹配的商品也可能不同。例如,在使用召回词“苹果”进行搜索的情况下,电商搜索系统返回的召回结果中可能存在“水果”品类和“手机”品类的商品,这两个品类与召回词“苹果”之间都具有较高的相关性,无法仅仅通过相关性进行排序。
发明内容
针对上述问题中的至少一个,本发明提供了一种分层排序方案,结合搜索结果的相关性与用户的个性化,提高了搜索结果的排序与用户的匹配性,从而提高搜索结果的点击通过率。
根据本发明的一个方面,提供了一种分层排序方法。该方法包括:基于多个用户的行为数据和商品类目数据构建样本集合,其中该样本集合包括多个样本,每个样本包括指示搜索词和与该搜索词相关的商品数据的第一字段和指示该搜索词和该商品数据之间的相关性的第二字段;基于该样本集合训练相关性模型以产生训练后的相关性模型;将基于特定用户输入的召回词的多个召回商品数据输入该训练后的相关性模型,以将该多个召回商品数据分为第一相关组和第一不相关组;基于每个召回商品数据的相关性和该召回商品数据的至少一种交易数据,对该第一相关组和该第一不相关组中的召回商品数据分别进行重新排序以产生第二相关组和第二不相关组;以及基于该特定用户的多个历史行为数据和梯度排序模型,对该第二相关组中的至少一部分召回商品数据进行重新排序以产生第三相关组。利用多个来源的数据构建大数据量的训练样本集并且利用组合模型降低了对线上系统的性能损耗。
在一种实现中,该样本集合包括第一样本集合和第二样本集合,并且其中基于多个用户的行为数据和商品类目数据构建样本集合包括:基于该多个用户的行为数据构建该第一样本集合,其中该第一样本集合包括多个第一样本,每个第一样本的第一字段包括用户搜索词和基于该用户搜索词的搜索结果的商品数据,该第一样本的第二字段包括指示该用户搜索词和基于该用户搜索词的搜索结果的商品数据之间的相关性的标签;基于该商品类目数据构建第二样本集合,其中该第二样本集合包括多个第二样本,每个第二样本的第一字段包括统计搜索词和与该统计搜索词对应的类目的商品数据,该第二样本的第二字段包括指示该统计搜索词和与该统计搜索词关联的类目的商品数据之间的相关性的标签;以及组合该第一样本集合和该第二样本集合以构建该样本集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于震坤行网络技术(南京)有限公司;震坤行工业超市(上海)有限公司,未经震坤行网络技术(南京)有限公司;震坤行工业超市(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011309163.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网站管理脚本安全认证的方法及系统
- 下一篇:VCSEL驱动电路及装置