[发明专利]生成扩展的搜索结果页面摘要的方法及装置有效
申请号: | 201110294672.4 | 申请日: | 2011-09-30 |
公开(公告)号: | CN103034633A | 公开(公告)日: | 2013-04-10 |
发明(设计)人: | 包胜华;陈健;杨新颖;周祥;苏中 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 周少杰 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 扩展 搜索 结果 页面 摘要 方法 装置 | ||
技术领域
本发明涉及搜索引擎中生成扩展的搜索结果页面摘要的技术领域,特别涉及生成表格式页面摘要的方法和系统。
背景技术
随着互联网业务的不断发展,各种现有的搜索引擎成为人们发现感兴趣的网络资源(例如网页)所不可缺少的工具。
搜索引擎通常以下述方式工作:一旦用户通过客户端提交了查询,搜索引擎将通过搜索结果页向用户返回搜索到的网页。搜索引擎的一个重要目标是针对用户特定的搜索查询提供用户所期望的链接集,另外一个目标是需要清楚并且快速地向用户通知与每个链接相关联的内容。因此,在返回搜索结果页时,除了网页的标题和统一资源标识符(URL)之外,搜索结果页还包含与网页相关的短文本描述。这种短文本描述通常被称为页面摘要(Snippet)。搜索引擎通常通过提取和组合包含查询所涉及的关键词的文本段从网页中提取页面摘要。在搜索结果页中,搜索引擎可以通过诸如高亮显示、加下划线、不同字体等等的各种手段使页面摘要中的查询关键词的显示区别于其它文本,以吸引用户的注意力并利于用户决定是否点击该网页。虽然现有技术中的页面摘要可一定程度上反映网页与查询的相关性,但由于目前的页面摘要由包含查询关键词的文本段构成,文本段的选择并未考虑文本段中除关键词之外的内容,特别是考虑文本段的表格格式信息。
而表格是一种重要的数据源,下面列出一些适合用表格展现的已经大量应用的数据类型:传统的Web Table类型数据,比如人员、公司、地点、商品、电影、音乐等信息,既包括有边框的表格,也包括无边框的表格;商业智能(BI)的应用使企业数据大量的以报表的形式生成(Web报表、PDF、Excel、Word等格式),很多企业级的BI分析和展现工具如IBM Cognos等会生成大量报表并进行发布,如此海量的数据在企业或互联网上有很强的搜索需求,使该发明有很大的应用前景,而且基于文件解析工具,各家主流的搜索引擎都已经把Excel Word等文档纳入检索。
为了提高用户的体验,现有技术中还提供有搜索结果预览功能,可以图片的方式预览到网页的信息,在日渐成熟的搜索引擎技术领域,改动的空间越来越小,也增加了对搜索引擎进行改进和创新的难度,因此,微小的改动也可能意味着用户体验的极大提升。然而,摘要(snippet)与预览(preview)是有区别的,预览并没有基于查询生成相关的片段供最终用户快速理解,而是简单的输出了原网页的内容。而摘要是供用户快速判断与查询词的相关性的,预览是在通过摘要判断完了之后,再进一步判断其相关性的。也就是说,二者使用的阶段不同。特别是摘要的显示空间很狭小,而预览的显示空间很大。摘要是默认显示的,而预览是默认不显示的,需要把鼠标移到特定位置(包括题目、摘要、网址等)上触发后才会显示,并且其显示需要一定的时间(依据显示内容和网络速度而定)。因此,对于所属领域技术人员来说,摘要和预览是完全不同的技术方案。
因此,对于表格这种数据源,其表格格式信息也是便于用户通过网页摘要快速理解搜索结果的极为重要的一部分,故需要进一步改进搜索技术,以至少在某种程度上在页面摘要中展示表格的格式信息。
发明内容
根据本发明的第一个方面,提供一种用于在搜索引擎中生成扩展的页面摘要的方法,包括:检索并返回具有与查询关键词相关的表格的关联表格网页;获得所述关联表格网页中表格的解析结果,基于所述解析结果抽取列名及各行实例;确定与所述查询关键词相关的行实例;根据所述列名及相关的行实例生成表格式页面摘要。
根据本发明的第二个方面,提供一种用于在搜索引擎中生成扩展的页面摘要的装置,包括:用于检索并返回具有与查询关键词相关的表格的关联表格网页的部件;用于获得所述关联表格网页中表格的解析结果,基于所述解析结果抽取列名及各行实例的部件;用于确定与所述查询关键词相关的行实例的部件;用于根据所述列名及相关的行实例生成表格式页面摘要的部件。。
采用本申请的技术方案,提供了一种扩展的页面摘要生成方案,可在在某种程度上在页面摘要中展示表格的格式信息。
附图说明
所附权利要求中阐述了被认为是本发明的特点的创造性特征。但是,通过参照附图阅读下面对说明性的实施例的详细说明可更好地理解发明本身以及其优选使用模式、目标、特征以及优点,在附图中:
图1示出了用来实现本发明实施方式的示例性计算系统。
图2示出了本申请生成扩展的搜索结果摘要的方法流程图。
图3示出了本申请生成扩展的搜索结果摘要的装置示意图。
图4示出了在一个实施方式中网页1的示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110294672.4/2.html,转载请声明来源钻瓜专利网。