[发明专利]一种基于图算法负载的图大数据流式划分方法有效
申请号: | 201911259604.7 | 申请日: | 2019-12-10 |
公开(公告)号: | CN111198977B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 曾国荪;程腾腾;丁春玲 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/901 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 王怀瑜 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 算法 负载 数据流 划分 方法 | ||
1.一种基于图算法负载的图大数据流式划分方法,其特征在于,该方法包括以下步骤:
数据加载与初始化步骤:加载图大数据,初始化子图;
度量测度选取与计算步骤:根据图大数据并行处理的目标,计算各子图的期望测度值;
启发式规则选取步骤:在预先制定的启发式规则集合中,根据划分需求,选取启发式规则;
子图划分步骤:通过图大数据处理系统,计算图大数据各顶点的预置位置,进行子图的划分,所述预置位置基于各子图的期望测度值和启发式规则计算;
所述度量测度选取与计算步骤具体为,若图大数据并行处理的目标是提高任务的完成时间,则根据第一测度计算式计算期望测度值;若图大数据并行处理的目标是提升系统资源利用率,则根据第二测度计算式计算期望测度值;
所述第一测度计算式为:
RandE(Gi,L,A)=ξiLoad(Gi,L,A)
式中,Gi为第i个子图,A为相应的图算法,RandE(Gi,L,A)为采用第一测度计算式的第i个子图的期望测度值,ξi为第i个计算节点的性能参数比值;V为图大数据;|V|为相应图的节点总数;α、β为常数,可分别取{0,0.5,1}三个值中的1个;ω为算法A在节点vi上进行运算的基本运算工作量,θ为节点vi经节点vi与节点vj相连接的边eij进行数据传输操作的基本工作量;即做加法或乘法;|E(vi)|为与节点vi相连接的边的条数。
2.根据权利要求1所述的一种基于图算法负载的图大数据流式划分方法,其特征在于,所述第二测度计算式为:
RandE(Gi,T,A)=ξiTime(Gi,T,A)
式中,Gi为第i个子图,A为相应的图算法,RandE(Gi,T,A)为采用第二测度计算式的第i个子图的期望测度值,ξi为第i个计算节点的性能参数比值,V为图大数据,|Vi|为子图Vi中节点的个数;α、β、γ为常数,可分别取{0,0.5,1}三个值中的1个;ω为算法A在节点vi上进行运算的基本运算工作量,θ为vi经eij进行数据传输操作的基本工作量;即做加法或乘法;|E(viq)|为与节点viq相连接的边的条数;si为计算节点pi的计算速度;bij为分区pi,pj之间的通信带宽;k个计算节点的性能参数之比为:ξ1:ξ2:…:ξk;ni为子图Gi中节点的总数;q为求和下标变量,取值从1到ni。
3.根据权利要求1所述的一种基于图算法负载的图大数据流式划分方法,其特征在于,所述度量测度选取与计算步骤还包括,若图大数据是规则的,并且图大数据处理系统的图算法是拓扑驱动的,则根据第三测度计算式计算期望测度值,所述第三测度计算式为:
RandE(Gi,NV,A)=ξi|Vi|
式中,RandE(Gi,NV,A)为采用第三测度计算式的第i个子图的期望测度值,ξi为第i个计算节点的性能参数比值,|Vi|为子图Vi中节点的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911259604.7/1.html,转载请声明来源钻瓜专利网。