[发明专利]基于深度学习的多机集群拓扑映射方法、装置及程序产品有效
申请号: | 202110839429.X | 申请日: | 2021-07-23 |
公开(公告)号: | CN113568860B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 吴志华;姜友和;白扬帆;常韬;于佃海;孙鹏;敖玉龙;巩伟宝 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F15/16 | 分类号: | G06F15/16;G06F15/163 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 集群 拓扑 映射 方法 装置 程序 产品 | ||
1.一种基于深度学习的多机集群拓扑映射方法,包括:
响应于接收到拓扑映射请求,获取多机集群的目标通信拓扑图;以及
获取多机集群的目标集群拓扑图,包括:通过网络接口获取多机集群中设备之间的跳步数;根据所述跳步数确定所述目标集群拓扑图,所述网络接口为所述多机集群外的一个接口,所述跳步数为一条路由要经过的路由器的数码,其中,所述目标集群拓扑图以所述多机集群中的多个设备为节点和以多个设备之间的物理链路为边,所述多个设备中的每个设备包括至少一个图形处理器,每个设备包括八个TOR节点,每个TOR节点与一个图像处理器通信连接;
将所述目标通信拓扑图映射到所述目标集群拓扑图,包括:利用贪婪算法进行节点映射;响应于完成节点映射,对所述目标通信拓扑图中的每条虚网链路,确定该条虚网链路的第一虚拟节点、第二虚拟节点映射至底层物理网络中的第一物理网节点、第二物理网节点;使用K最短路径算法寻找第一物理网节点、第二物理网节点之间的第1-K条最短路径;响应于第1-K条最短路径中的第i条路径满足该条虚网链路的带宽,该条虚网链路映射成功;响应于所有的虚网链路映射成功,链路映射完成,1≤i≤K;
其中,将所述目标通信拓扑图映射到所述目标集群拓扑图,还包括:响应于目标集群拓扑图不为预设的集群拓扑图,利用所述拓扑映射请求包括的切分策略对应的图切分算法将目标通信拓扑图进行分组,并根据分组的目标通信拓扑图匹配到所述目标集群拓扑图对应的拓扑层级。
2.根据权利要求1所述的基于深度学习的多机集群拓扑映射方法,其中,所述响应于接收到拓扑映射请求,获取多机集群的目标通信拓扑图,包括:
响应于接收到拓扑映射请求,利用探测工具探测所述拓扑映射请求包括的预设的进程数中的进程之间的通信模式及通信量;
根据所述通信模式和通信量,确定所述目标通信拓扑图。
3.根据权利要求1或2所述的基于深度学习的多机集群拓扑映射方法,其中,所述获取多机集群的目标集群拓扑图,包括:
响应于所述多机集群为非图形处理器集群,利用lspci工具获取多机集群的目标集群拓扑图。
4.根据权利要求1或2所述的基于深度学习的多机集群拓扑映射方法,其中,所述目标集群拓扑图为无向加权图。
5.根据权利要求3所述的基于深度学习的多机集群拓扑映射方法,其中,所述目标集群拓扑图为无向加权图。
6.根据权利要求1所述的基于深度学习的多机集群拓扑映射方法,其中,在获取多机集群的目标集群拓扑图之后,所述方法还包括:
确定是否初始化目标集群拓扑图;
响应于未初始化目标集群拓扑图,确定目标集群拓扑图是否为预设的集群拓扑图;
响应于目标集群拓扑图为预设的集群拓扑图,对目标通信拓扑图进行初始化,得到初始化的通信拓扑图;
将所述目标通信拓扑图映射到所述目标集群拓扑图,包括:
将所述初始化的通信拓扑图映射到目标集群拓扑图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110839429.X/1.html,转载请声明来源钻瓜专利网。