[发明专利]一种Spark并发子图查询的方法在审
申请号: | 201711346701.0 | 申请日: | 2017-12-15 |
公开(公告)号: | CN108090179A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 王明兴 | 申请(专利权)人: | 北京海致星图科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种Spark并发子图查询的方法,包括生成查询图的查询计划、数据图数据预处理、从查询计划中取第一个查询子图,计算匹配实例和匹配点集、依次从查询计划中取下一个查询子图,计算该查询子图的匹配实例和匹配点集,将其与之前的匹配结果合并、查询计划执行完成后输出最终的匹配结果。本发明提供一种Spark并发子图查询的方法,通过当前的子图匹配算法,适用于Spark平台,效率比较高,能使用多台机器并行处理,能力较强,容易处理大规模数据。 | ||
搜索关键词: | 查询计划 子图查询 查询 并发 匹配点集 匹配结果 匹配 大规模数据 数据预处理 并行处理 匹配算法 数据图 取下 输出 合并 | ||
【主权项】:
1.一种Spark并发子图查询的方法,其特征在于:包括以下步骤:S1:生成查询图的查询计划,将其拆分成多个查询子图,每个查询子图包含1条或多条边,所有的边包含一个公共的顶点;S2:数据图数据预处理,原始数据图给出了每个顶点和边的属性值,查询子图中给出了顶点和边的匹配函数,预处理过程中先判断数据图中每个顶点与查询子图中哪些顶点匹配,数据图中的每条边与查询子图中哪些边匹配;S3:从查询计划中取第一个查询子图,计算匹配实例和匹配点集;S4:依次从查询计划中取下一个查询子图,计算该查询子图的匹配实例和匹配点集,将其与之前的匹配结果合并;S5:查询计划执行完成后输出最终的匹配结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京海致星图科技有限公司,未经北京海致星图科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711346701.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种文本数据分析方法、装置、服务器和存储介质
- 下一篇:图书馆管理系统