[发明专利]一种基于Ranknet和Lambdamart算法的搜索排序方法在审
申请号: | 201910654609.3 | 申请日: | 2019-07-19 |
公开(公告)号: | CN110489616A | 公开(公告)日: | 2019-11-22 |
发明(设计)人: | 刘胜美;程睿 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/9038 | 分类号: | G06F16/9038 |
代理公司: | 32102 南京苏科专利代理有限责任公司 | 代理人: | 姚姣阳<国际申请>=<国际公布>=<进入 |
地址: | 210012 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于Ranknet算法和LambdaMART算法的搜索排序方法,可以提高搜索排序的迭代效率和准确率,尤其是在主题性较强的领域。该方法在传统的LambdaMART算法的基础上对其进行改进,首先将Ranknet算法作为基础模型,学习一个排序函数,再将函数的输出作为LambdaMART的初始函数,最终生成排序模型。此方法可以有效改善损失函数为凸函数时,为达到全局的最小值,学习率必须很小,迭代次数必须很大的问题,而且在减少迭代次数的情况下,模型效果却可以优于原始模型。 | ||
搜索关键词: | 算法 迭代 排序 搜索 基础模型 模型效果 排序函数 排序模型 损失函数 原始模型 传统的 凸函数 主题性 准确率 输出 学习 全局 改进 | ||
【主权项】:
1.一种基于Ranknet和Lambdamart算法的搜索排序方法,其特征在于,包括如下步骤,/n步骤S1、由Rankbet算法训练出基本模型,首先训练一个打分函数,根据打分函数计算文档的得分,通过文档的得分情况计算文档的偏序概率和真实概率,采用交叉熵作为损失函数来衡量偏序概率对真实概率的拟合程度,从而获取所有文档的总代价函数;/n步骤S2、计算每个文档的梯度lambda和偏导,针对步骤S1中的损失函数对排序函数的偏导求导,再利用梯度下降法获取最佳参数;/n步骤S3、利用Lambdamart算法训练回归树;/n步骤S4、将步骤S2中获取的梯度作用于Lambdamart算法的GBDT上,作为训练模型的拟合对象,再根据牛顿法计算训练树的叶子节点值;/n步骤S5、更新模型,根据学习率计算每个文档的得分。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910654609.3/,转载请声明来源钻瓜专利网。