[发明专利]突发时效性查询词识别方法和系统在审
申请号: | 201410211458.1 | 申请日: | 2014-05-19 |
公开(公告)号: | CN103995865A | 公开(公告)日: | 2014-08-20 |
发明(设计)人: | 苏文杰;常富洋;秦吉胜;周鸿祎 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 突发 时效性 查询 识别 方法 系统 | ||
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种突发时效性查询词识别方法和系统。
背景技术
突发时效性查询词是短时间内用户对其的查询量较之前明显变大的查询词,所以突发时效性查询词往往反映的是一个新的事件的爆发,引发用户对事件的关注,其具有很强的时效性。因此,及时识别出突发时效性查询词,并根据突发时效性查询词来调整搜索引擎中新闻的排名,可以有效提升用户对新闻的搜索体验,改善搜索引擎的质量。
现有的识别突发时效性查询词的方法,是根据查询词在当前时间段的查询量和在前一段时间的查询量比较,差值越大越说明该查询词可能是当前时间段的突发时效性查询词。
上述技术方案的缺点在于,如两段时间内查询词的查询量维持较小的量级,则可能造成查询词的查询量出现了突增但差值却较小的情况,而差值过小则造成无法识别出该突发时效性查询词,例如:
1、一些查询量大的查询词的查询量改变会掩盖突发时效性查询词,比如,查询词A的查询量由10000变为11000,那么差值就为1000,而突发时效性查询词的查询量由100变为200,查询量虽然翻倍但差值仅为100,与查询词A差值相比较小,无法体现出查询量的突增变化,造成难以识别出该突发时效性查询词。
2、一般地,统计查询量的时间段设置的比较小(如按小时设置),由于查询词的查询量受时间影响较大,在凌晨时段的整体查询量较小,在凌晨比较查询量得到的差值也较小,所以难以识别出突发时效性查询词;如为了克服该问题,将时间段设置的比较大(如按天设置),进行不同时间段的查询量比较的时间间隔就比较久,那么突发时效性查询词会更新比较慢。
所以,本发明需要解决的技术问题在于,提供一种新的识别突发时效性查询词的技术方案,保证即使在查询词的查询量始终维持在较小量级的情况下,也能有效地识别出突发时效性查询词。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的突发时效性查询词识别方法和系统。
依据本发明的一个方面,提供了一种突发时效性查询词识别方法,其包括:分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势,所述第二段时间为所述第一段时间的一部分;比较所述查询词在所述第一段时间和所述第二段时间内的查询量变化趋势之间的差距,并根据所述差距的大小判断所述查询词是否为突发时效性查询词。
可选地,前述的突发时效性查询词识别方法,所述分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势的步骤包括:按预设长度的时间段,连续多次统计所述查询词的查询量;取最近的连续m个时间段为所述第一段时间,并根据所述查询词在所述m个时间段内的查询量,确定所述查询词在所述第一段时间内的查询量变化趋势,m为整数;取最近的连续n个时间段为所述第二段时间,并根据所述查询词在所述n个时间段内的查询量,确定所述查询词在所述第二段时间内的查询量变化趋势,n为小于m的整数。
可选地,前述的突发时效性查询词识别方法,所述比较所述查询词在所述第一段时间和所述第二段时间内的查询量变化趋势之间的差距的步骤包括:取反映所述查询词在所述第一段时间内的查询量变化趋势的第一轨迹线,以及反映所述查询词在所述第二段时间内的查询量变化趋势的第二轨迹线,并将所述第一轨迹线以及所述第二轨迹线的夹角作为所述差距。
可选地,前述的突发时效性查询词识别方法,还包括:获取所述查询词对应的多个搜索结果条目,所述多个搜索结果条目中包含新闻信息条目;为所述多个搜索结果条目分别设置权值;在所述查询词为突发时效性查询词时,增大所述新闻信息条目的权值;根据所述多个搜索结果条目的权值大小,在所述查询词对应的搜索结果页上,确定所述多个搜索结果条目的排名位置。
依据本发明的另一方面,提供了一种突发时效性查询词识别系统,其包括:变化趋势计算模块,用于分别计算查询词在第一段时间内和第二段时间内的查询量变化趋势,所述第二段时间为所述第一段时间的一部分;识别模块,用于比较所述查询词在所述第一段时间和所述第二段时间内的查询量变化趋势之间的差距,并根据所述差距的大小判断所述查询词是否为突发时效性查询词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410211458.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:工业电弧炉余热利用及烟气回收装置
- 下一篇:一种细菌培养皿用加热风干清理装置