[发明专利]推送包含新闻信息的网页的方法和装置有效
申请号: | 201410116836.8 | 申请日: | 2014-03-26 |
公开(公告)号: | CN103942264B | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 常富洋;秦吉胜;苏文杰 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙)11348 | 代理人: | 王伟锋,刘铁生 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推送 包含 新闻 信息 网页 方法 装置 | ||
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种推送包含新闻信息的网页的方法和装置。
背景技术
根据目前搜索引擎技术,用户在其终端上输入查询词后,搜索引擎会获取与查询词对应的多个网页URL,该多个网页URL返回到用户终端后,会在用户终端的结果页上展现。
由于网页URL的数量为多个,则在结果页上展现时必然存在排序问题。根据目前的搜索引擎技术,一般排序在前的都是较旧的网页URL。这种排序对于包含新闻信息的网页URL来说存在较大缺陷:在用户输入查询词来搜索新闻的场景下,所以目前的搜索引擎技术只能将旧新闻的网页URL排序在前,而最新新闻的网页URL排序在后,但由于新闻具有时效性的特点,大部分新闻的新闻性都是随着时间的推移而降低,则用户最终查看到的很可能是新闻性较低的新闻,新闻性较高的新闻由于其网页URL排序靠后,用户难以发现并打开。
由此可见,现有的搜索引擎技术难以分析新闻信息对用户的新闻性,难以恰当地对包含新闻信息的网页URL进行排序,进而无法完成对包含新闻信息的网页的有效推送。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的推送包含新闻信息的网页的方法和装置。
依据本发明的一个方面,提供了一种推送包含新闻信息的网页的方法,其包括:将查询词与预存的时效性关键词进行匹配;如所述查询词与所述时效性关键词匹配,则获取所述查询词的时效性;根据所述查询词的时效性强弱,确定在结果页中插入的与所述时效性关键词对应的包含新闻信息的网页的URL的位置。
可选地,所述获取所述查询词的时效性的步骤包括:获取所述查询词对应的多个网页的URL;计算所述多个网页与所述包含新闻信息的网页之间的差别;根据所述多个网页与所述包含新闻信息的网页之间的差别,计算所述查询词的时效性。
可选地,所述计算所述多个网页与所述包含新闻信息的网页之间的差别的步骤包括:计算所述多个网页的第一时效属性特征;将所述第一时效属性特征与预存的所述包含新闻信息的网页的第二时效属性特征进行比较,得到所述多个网页与所述包含新闻信息的网页之间的差别。
可选地,所述第一时效属性特征包括所述多个网页的分类、所述多个网页的生成时间、所述查询词在所述多个网页中出现的频度和/或所述查询词在所述多个网页中的出现次数与已知历史出现次数之间的对比数据。
可选地,所述根据所述查询词的时效性强弱,确定在结果页中插入的与所述时效性关键词对应的包含新闻信息的网页的URL的位置的步骤包括:在所述结果页上划分多个区间,分别对应不同强弱程度的时效性;选择与所述查询词的时效性强弱匹配的区间,并将所述包含新闻信息的网页的URL置于所选区间中。
可选地,每个区间分为自上而下的三个部分,且每个区间具有对应的置信度,所述将所述包含新闻信息的网页的URL置于所选区间中的步骤还包括:如所述查询词的时效性高于所选区间的置信度,则将所述包含新闻信息的网页的URL置于所选区间中的最上部分,如所述查询词的时效性与所选区间的置信度一致,则将所述包含新闻信息的网页的URL置于所选区间中的中间部分,如所述查询词的时效性低于所选区间的置信度,则将所述包含新闻信息的网页的URL置于所选区间中的最下部分。
依据本发明的另一方面,还提供一种推送包含新闻信息的网页的装置,其包括:关键词数据库,用于预存时效性关键词;关键词匹配模块,用于将查询词与预存的时效性关键词进行匹配;查询词时效性获取模块,用于如所述查询词与所述时效性关键词匹配,则获取所述查询词的时效性;新闻网页展示模块,用于根据所述查询词的时效性强弱,确定在结果页中插入的与所述时效性关键词对应的包含新闻信息的网页的URL的位置。
可选地,还包括:网页URL获取模块,用于获取所述查询词对应的多个网页的URL;差别计算模块,用于计算所述多个网页与所述包含新闻信息的网页之间的差别;所述查询词时效性获取模块根据所述多个网页与所述包含新闻信息的网页之间的差别,计算所述查询词的时效性。
可选地,还包括:特征计算器,用于计算所述多个网页的第一时效属性特征;所述差别计算模块,用于将所述第一时效属性特征与预存的所述包含新闻信息的网页的第二时效属性特征进行比较,得到所述多个网页与所述包含新闻信息的网页之间的差别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410116836.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型履带
- 下一篇:一种采用石墨烯覆盖的微光纤气体传感器
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置