[发明专利]搜索引擎的质量评估方法和装置有效
申请号: | 201510927675.5 | 申请日: | 2015-12-14 |
公开(公告)号: | CN105573887B | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 魏博;齐志兵;李力行;邹敏;唐广宇;顾思斌;潘柏宇;王冀 | 申请(专利权)人: | 合一网络技术(北京)有限公司 |
主分类号: | G06F11/30 | 分类号: | G06F11/30;G06F11/36;G06F17/30 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询词 多媒体资源 搜索引擎 质量评估 停留 方法和装置 评估指标 播放 人工标注 用户日志 评估 搜索 | ||
1.一种搜索引擎的质量评估方法,所述搜索引擎用于搜索多媒体资源,其特征在于,所述质量评估方法包括:
从用户日志获取单一查询词的用户深度停留数据,其中,所述单一查询词的用户深度停留数据包括:查询词、被点击多媒体资源集合、多媒体资源播放完成比集合、以及所述被点击多媒体资源集合到所述多媒体资源播放完成比集合的映射函数;
根据所述单一查询词的用户深度停留数据,获得全量查询词的用户深度停留数据,其中,所述全量查询词的用户深度停留数据包括:全量查询词、当前查询词下的被点击多媒体资源、当前查询词下的被点击多媒体资源的被点击次数、以及当前查询词下的被点击多媒体资源的综合播放完成比;以及
根据所述全量查询词的用户深度停留数据和原始评估指标,对所述搜索引擎的质量进行原始评估,
其中,所述原始评估指标包括独立被点击多媒体资源的个数、每个查询词的被点击多媒体资源的平均个数、低于多媒体资源个数阈值的查询词的个数、多媒体资源播放完成比总体平均值、低于多媒体资源播放完成比阈值的查询词的个数中的至少一个。
2.根据权利要求1所述的质量评估方法,其特征在于,还包括:
根据所述单一查询词的用户深度停留数据,计算所述单一查询词的用户深度停留指数;以及
根据所述用户深度停留指数和综合评估指标,对所述搜索引擎的质量进行综合评估,
其中,所述综合评估指标包括用户深度停留指数平均值和低于用户深度停留指数阈值的查询词的个数中的至少一个。
3.根据权利要求2所述的质量评估方法,其特征在于,所述根据所述单一查询词的用户深度停留数据,计算所述单一查询词的用户深度停留指数,包括:
根据所述单一查询词的用户深度停留数据并采用公式计算所述单一查询词的用户深度停留指数,
其中,y是所述单一查询词的用户深度停留指数,
x=VidCount*ClickCount*AveragePerc,VidCount是独立被点击多媒体资源的个数,ClickCount是被点击多媒体资源的次数,AveragePerc是多媒体资源的播放完成比平均值。
4.根据权利要求2所述的质量评估方法,其特征在于,所述根据所述单一查询词的用户深度停留数据,计算所述单一查询词的用户深度停留指数,包括:
根据所述单一查询词的用户深度停留数据并采用公式y=VidCountN*ClickCountN*AveragePercN,计算所述单一查询词的用户深度停留指数,
其中,y是所述单一查询词的用户深度停留指数,
VidCount是独立被点击多媒体资源的个数,ClickCount是被点击多媒体资源的次数,AveragePerc是多媒体资源的播放完成比平均值,min( )取最小值,max( )取最大值。
5.根据权利要求2所述的质量评估方法,其特征在于,所述根据所述单一查询词的用户深度停留数据,计算所述单一查询词的用户深度停留指数,包括:
根据所述单一查询词的用户深度停留数据并采用公式计算所述单一查询词的用户深度停留指数,
其中,y是所述单一查询词的用户深度停留指数,
VidCount是独立被点击多媒体资源的个数,AllVidCount是利用所述单一查询词搜索到的多媒体资源的所有点击次数的总和,AveragePerc是多媒体资源的播放完成比平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合一网络技术(北京)有限公司,未经合一网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510927675.5/1.html,转载请声明来源钻瓜专利网。