[发明专利]一种对搜索结果进行排序的方法及装置有效
申请号: | 201310392145.6 | 申请日: | 2013-09-02 |
公开(公告)号: | CN104424291B | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 霍承富;郑伟;朱江涛;林锋 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许志勇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 结果 进行 排序 方法 装置 | ||
本申请提出一种对搜索结果进行排序的方法及装置。该方法包括:当接收到包含当前查询词的查询请求时,根据历史统计数据获得当前查询词对应的搜索结果中包括的对象的历史点击率及曝光数;根据当前查询词和对应对象的特征得到对象的初步预估点击率;以及根据历史点击率、曝光数和初步预估点击率,通过非线性拟合得到对象的最终预估点击率;以及根据最终预估点击率对对象进行排序。本申请所提出的方案有效地达到了准确的点击率预估,进而实现了更准确的搜索结果排序,以满足用户的需求和方便用户的使用。
技术领域
本申请涉及计算机网络信息领域,尤其涉及一种对搜索结果进行排序的方法及装置。
背景技术
随着互联网业务迅速发展,通过互联网进行多种多样的信息交互成为当今最为广泛的应用。然而,当多种业务同时交互应用时就会产生交互应用堵塞现象。例如,用户想要搜索某一产品时,就会同时出现众多产品列表,但呈现在用户眼前的并不都是用户所需要的,甚至有很多与搜索内容是无关的,这就说明,对搜索结果的排序不够合理化或不够精确。因此,不但给用户应用带来了许多的不便,而且也带来了网络资源的浪费。从而这也体现出合理精确化排序的重要性。
当前现有技术中对搜索结果进行排序的方法通常是根据对搜索结果中包括的对象预估的点击率来对对象进行排序,而预估点击率的方法通常是基于特征提取和模型训练的模型预估。具体而言,提取历史查询词和对应的历史对象的文本特征和相关性特征来建立预估模型对对象的点击率进行预估,这些特征一定程度上能够影响用户的关注度,从而描述用户的点击行为。依据此种模型预估的点击率对搜索结果进行排序的方法尽管减少了一些不必要的资源浪费,但是其精确度却不高并且有时还会遗漏相关的重要信息。
例如,在上述方法中只关注了用户已经点击过的对象的文本特征和相关性特征,而没有考虑到对象本身对用户的点击行为也起到关键作用的其它重要特征,如图片视觉感知和标签等难以被特征化表示的信息,因而并不能精确地反映出用户的点击行为,也就是预估精确度有待提高。另外,由于只关注了用户点击过的对象,因此忽略了一些暂时没有用户点击或点击量很低的对象,而这种对象往往很可能包含特定用户当前所希望搜索到的信息。当用户搜索这种对象时,由于其点击量过小而无法被搜索到,这就带来资源信息的滞留和浪费。此外,针对拥有大量用户搜索行为、少量用户点击行为的对象来说,由于用户对它的点击行为较少,会造成该对象可能被忽略而不被呈现给用户。因此,现有技术中的方法并没有充分和合理地利用网络日志中的历史数据信息。
发明内容
本申请的主要目的在于提供一种对搜索结果进行排序的方法及装置,以解决现有技术存在的上述问题。
根据本申请的一个方面的实施例,提出一种对搜索结果进行排序的方法,包括:当接收到包含当前查询词的查询请求时,根据历史统计数据获得当前查询词对应的搜索结果中包括的对象的历史点击率及曝光数;根据当前查询词和对应对象的特征得到对象的初步预估点击率;以及根据历史点击率、曝光数和初步预估点击率,通过非线性拟合得到对象的最终预估点击率;以及根据最终预估点击率对对象进行排序。
根据本申请的实施例,在该方法中,非线性拟合是指数型非线性拟合。
根据本申请的实施例,在该方法中,还包括:从网络日志数据中获得曝光数大于或等于预定阈值的历史查询词和历史查询词对应的对象;以及通过统计得到历史统计数据,所述历史统计数据包括历史查询词对应的对象的历史点击率和曝光数。
根据本申请的实施例,在该方法中,根据历史统计数据获得当前查询词对应的搜索结果中包括的对象的历史点击率及曝光数包括:当当前查询词与历史查询词中的一个匹配时,将历史查询词对应的对象的历史点击率和曝光数,作为当前查询词对应的搜索结果中包括的对象的历史点击率及曝光数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310392145.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:兴趣点选择方法及装置
- 下一篇:出版物数字资源的自动采集方法及系统