[发明专利]使用数据结构处理搜索查询有效
申请号: | 201210409001.2 | 申请日: | 2012-10-24 |
公开(公告)号: | CN102999558A | 公开(公告)日: | 2013-03-27 |
发明(设计)人: | K.特雷特贾科夫;L.加西亚-巴吕洛斯;A.阿马斯-切尔文特斯;J.维洛;M.G.杜马斯 | 申请(专利权)人: | 斯凯普公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李舒;汪扬 |
地址: | 爱尔兰*** | 国省代码: | 爱尔兰;IE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 数据结构 处理 搜索 查询 | ||
技术领域
本发明涉及处理搜索查询,并且具体地涉及生成用于在互连节点网络中处理查询的数据结构。
背景技术
存在计算机网络典型地包括很大数目的互连节点的许多情形。例如Skype的通信网络代表用于对等通信的大型社交网络。图1是典型计算机网络的一小部分的示意图。示出的网络包括多个节点Ni。每个节点可以如图所示与一个或者多个物理计算机设备关联,例如在节点Ni的情况下示出了该节点与移动设备2、PC 4和平板电脑6关联。每个节点与单个用户关联,该用户在这一情况下可以使用这些计算机设备中的任何一个来向特定网络注册或者登录。示出了节点由连接Ci互连。在物理网络的背景中,可以用任何已知的有线或者无线方式实施连接Ci。在与节点关联的用户的背景中,连接未必涉及网络中的单个物理连接,但是代表与在连接的任一端处的节点关联的用户之间的关系。作为例子,在Skype的情况下,两个用户在他们处于彼此的联系人列表中的情况下被视为连接。对这样的网络的常见挑战是允许用户例如按照姓名搜寻另一用户并且看见搜索的结果,这些结果以它们到他的最短路径距离的顺序排列。类似地,用户可能希望知道什么联系人链允许他到达网络中的另一用户。对解决该问题的尝试已经使用分析技术以便找到在图形中的给定一对节点之间的最短路径。
存在有解决这一问题的许多方法。现有方法可以广义地分类为精确的和近似的。对于在具有数以亿计的顶点的图形上执行在线查询,精确方法(如基于Dijkstra遍历的方法)极其缓慢,该顶点数目是现代社交网络的典型大小。在近似方法之中,用于这一问题的可扩展的算法系列是所谓的基于地标(或者基于略图)的方法。在这一技术系列中,选择地标节点的固定集并且预先计算从每个顶点到一些或者所有地标的距离。关于到地标的距离的知识连同三角不等式一起典型地允许人们在O(k)时间、O(kn)空间内计算任何两个顶点之间的近似距离,其中k是地标数目并且n是网络中的顶点数目。然后可以原样使用那些估计或者进一步利用它们作为图形遍历或者路由策略的组成成分(component)以便获得精确的最短路径。
基于地标的方法的一个重要方面是选择地标的方式——仔细选择策略可以具有显著正面效果。已经建议了如下策略:这些策略依赖于选择具有高程度、居间-和接近-中心性的地标以及保证在图形上及其路径上恰当分散地标。
参考Potamias等人的标题为“Fast Shortest Path Distance Estimation in Large networks”的论文,该论文发表于CIKM ’09:2009年美国纽约第18届信息和知识管理国际会议的会议录第867-878页。在该论文中,在不同地标选择策略之下评估基于地标的距离估计算法。根据这篇论文,已经表明最高程度和接近中心性技术典型地产生最高精度。
虽然基于地标的算法未提供关于近似质量的强理论保障,但是已经表明它们在实践中表现良好从而升级至具有数以百万或者甚至数十亿计的边的图形,而精度是可接受的并且响应时间在每个查询一秒以下。
本发明的目的是较现有技术而言提高精度,而用于生成在处理搜索查询时使用的数据结构的计算时间是可接受的。
发明内容
根据本发明的一个方面,提供一种生成存储于计算机存储器中用于在互连节点网络中处理搜索查询的数据结构的方法,其中该方法包括通过以下步骤选择地标节点并且在数据结构中存储所选择的地标节点:从网络节点采样顶点对的第一样本;计算每个顶点对的最短路径,每个最短路径包括在该顶点对中的每个顶点之间的顶点集;标识比任何其它顶点更经常出现于更多最短路径中的第一地标节点;从网络顶点去除包括第一地标节点的最短路径;标识比任何其它剩余顶点出现于更多剩余最短路径中的第二地标节点。
本发明还提供一种计算机程序产品,该计算机程序产品包括在由计算机执行时实现上文限定的方法的步骤的程序代码装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯凯普公司,未经斯凯普公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210409001.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数字矿山安全监测监控系统
- 下一篇:微处理器及缩短分页表寻访时间的方法