[发明专利]搜索评价方法及装置在审
申请号: | 201810885991.4 | 申请日: | 2018-08-06 |
公开(公告)号: | CN109086417A | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 罗成;刘奕群;张帆;毛佳昕;许静芳;汪萌;张敏;马少平 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索结果 搜索 浏览 目标页 期望 分布函数 概率 收益 | ||
1.一种搜索评价方法,其特征在于,包括:
根据搜索页面中的多个搜索结果的相关性评分和点击必要性评分,确定每个搜索结果被点击的概率,其中,所述相关性评分用于表征搜索关键词和所述搜索结果之间的相关性,所述点击必要性评分用于表征搜索结果的摘要的完善程度;
根据每个搜索结果的摘要的深度、每个搜索结果的目标页面的深度以及所述每个搜索结果被点击的概率,确定每个搜索结果的期望浏览深度,其中,所述目标页面为搜索结果受到点击后跳转的页面;
根据每个搜索结果的期望浏览深度,确定每个搜索结果的期望浏览起始深度;
根据每个搜索结果的期望浏览起始深度、每个搜索结果的摘要的深度、每个搜索结果的目标页面的深度、每个搜索结果的相关性评分以及浏览深度分布函数,确定每个搜索结果的收益;
根据多个搜索结果的收益,确定所述搜索页面的评分。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在训练集中的训练搜索页面的训练搜索结果中,确定具有各种相关性评分和点击必要性评分的训练搜索结果被点击的概率,其中,所述训练搜索页面与训练搜索关键词相对应。
3.根据权利要求2所述的方法,其特征在于,在训练集中的训练搜索页面的训练搜索结果中,确定具有各种相关性评分和点击必要性评分的训练搜索结果被点击的概率,包括:
在所述训练搜索页面的训练搜索结果中,确定具有第一相关性评分和第一点击必要性评分的训练搜索结果的第一数量;
在具有第一相关性评分和第一点击必要性评分的训练搜索结果中,确定受到点击的训练搜索结果的第二数量;
将所述第二数量与所述第一数量的比值确定为具有第一相关性评分和第一点击必要性评分的训练搜索结果被点击的概率。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据训练集中的训练搜索页面的浏览深度,确定所述浏览深度分布函数,其中,所述浏览深度用于表征所述训练搜索页面的被显示的最深的位置在训练搜索页面中的深度。
5.根据权利要求4所述的方法,其特征在于,根据训练集中的训练搜索页面的浏览深度,确定所述浏览深度分布函数,包括:
确定所述浏览深度与每个浏览深度的训练搜索页面的数量之间的关系曲线;
对所述关系曲线进行拟合,确定所述浏览深度分布函数。
6.根据权利要求5所述的方法,其特征在于,对所述关系曲线进行拟合,确定所述浏览深度分布函数,包括:
根据公式对所述关系曲线进行拟合,确定所述浏览深度分布函数,其中,D(h)为所述浏览深度分布函数,h为所述浏览深度,Φ为标准高斯分布的累积分布函数,λ和μ为拟合参数。
7.根据权利要求1所述的方法,其特征在于,根据每个搜索结果的摘要的深度、每个搜索结果的目标页面的深度以及所述每个搜索结果被点击的概率,确定每个搜索结果的期望浏览深度,包括:
根据公式确定每个搜索结果的期望浏览深度,其中,evhk为第k个搜索结果的期望浏览深度,P(C|Rk,Nk)为第k个搜索结果被点击的概率,Rk为第k个搜索结果的相关性评分,Nk为第k个搜索结果的点击必要性评分,为第k个搜索结果的目标页面的深度,为第k个搜索结果的摘要的深度。
8.根据权利要求1所述的方法,其特征在于,根据每个搜索结果的期望浏览深度,确定每个搜索结果的期望浏览起始深度,包括:
根据公式确定每个搜索结果的期望浏览起始深度,其中,startk为第k个搜索结果的期望浏览起始深度,evhi为第i个搜索结果的期望浏览深度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810885991.4/1.html,转载请声明来源钻瓜专利网。