[发明专利]搜索结构化地理数据有效
申请号: | 200880010447.X | 申请日: | 2008-02-04 |
公开(公告)号: | CN101647020A | 公开(公告)日: | 2010-02-10 |
发明(设计)人: | 阿尔乔姆·佩塔科夫;大卫·米诺谷;亚历克赛·斯皮里多诺夫 | 申请(专利权)人: | 谷歌公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 张焕生;安 翔 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 结构 地理 数据 | ||
技术领域
本公开涉及针对用户搜索提供结果。
背景技术
查询处理系统一般用于从大量数据收集定位信息。示例性系统包 括:响应于寻求识别相关web内容的用户所输入的一个或多个用户搜索 词语而识别相关网页的那些系统。在网页搜索系统中,可以通过将搜 索查询中的词语与预先存储的网页的语料集进行匹配来识别搜索结 果。
数据收集还可以包括结构化文档,该结构化文档可以包括潜在的 大量数据,其中的小的子集与特定搜索相关。一个示例性结构化文档 是锁眼标记语言(Keyhole Markup Language)(KML)文档,其是用 于在诸如“Google Earth”的浏览器中显示地理数据的基于XML的文件 格式。KML文档利用具有嵌套元素和属性的基于标签的结构,并且可 被用于将描述文本、模型、和图像与地球表面上的位置进行关联。
尽管网页搜索系统擅长于识别作为整体匹配于查询的各个词语的 文档,但是其不能识别在场境(context)中匹配于查询的参数的结构 化文档的元素。作为说明性示例,搜索系统可能不只返回存储在KML 文档内的最相关数据。所以,用户不能基于结构化文档的内容,诸如 嵌套元素和属性,来搜索结构化文档。例如,用户不能通过指定感兴 趣的地理区域、通过基于关键词来过滤KML文件或通过指定这类搜索 查询的组合,来搜索KML文件的元素。
发明内容
以下公开描述了允许对搜索查询结果进行识别的系统、方法、和 计算机程序产品。
根据一方面,公开了一种方法。该方法包括识别来自一个或多个 数据源的数据,其中数据与至少一个结构化文档相关联,并且提取包 含在至少一个结构化文档内的一个或多个数据集。该方法进一步包括 将一个或多个记录项添加到可搜索的数据库,其中一个或多个记录项 对应于一个或多个已提取的数据集。
根据一方面,该方法可以包括从一个或多个数据源检索数据。此 外,一个或多个数据源中的至少一个可以包括一个或多个统一资源定 位符(URL)。根据一方面,数据是至少一个结构化文档。数据还可 以包括元数据,诸如页面排名。根据另一方面,该方法可以包括:在 识别来自一个或多个数据源的数据之后,识别与数据相关联的元数据。
根据又一方面,该方法可以包括产生输出文件,其中输出文件包 括与两个或更多个结构化文档相关联的数据。提取一个或多个数据集 还可以包括:从输出文件中提取一个或多个数据集。另外,根据一方 面,至少一个结构化文档可以包括两个或更多个结构化文档,并且该 方法可以进一步包括将这两个或更多个结构化文档进行合并。
根据另一方面,该至少一个结构化文档包括锁眼标记语言(KML) 文档。另外,该一个或多个数据集可以至少包括一个地标。该方法还 可以包括:接收至少一个搜索查询,并且响应于接收至少一个搜索查 询,对一个或多个记录项中的至少一个进行识别。此外,提取包含在 至少一个结构化文档内的一个或多个数据集可以包括:将一个或多个 数据集与和该至少一个结构化文档相关联的场境信息进行关联。
可以使用系统、方法、或计算机程序、或系统、方法和计算机程 序的任何组合来实施这些通用和特定方面。
附图说明
图1示出根据说明性实施方式的搜索系统。
图2示出根据说明性实施方式的图1的搜索系统内的服务器的组 件。
图3示出根据说明性实施方式的搜索系统。
图4示出说明性KML文件。
图5示出根据实施方式的用于从一个或多个数据源收集和合并文 档和元数据的示例性过程。
图6示出说明性示例输出文件,其包括由URL所索引的单个文件。
图7示出根据实施方式的用于提取结构化文件的示例性过程流。
图8示出说明性示例输出文件,其包括对应于单个URL的多个记录 项。
图9示出根据实施方式的结构化文档收集和提取的过程。
具体实施方式
现在将参考附图更加详细地描述本公开,在附图中示出一些但不 是所有的实施方式。实际上,这些实施方式可以具体化为很多不同形 式,并且不应被解释为限于此处所阐述的实施方式;而是提供这些实 施方式来使得本公开将满足适用的法律要求。通篇中相同的附图标记 指示相同的元素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200880010447.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:取得指纹的装置和方法
- 下一篇:存储器系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置