[发明专利]一种AI训练平台的网卡通信方法、装置、设备及介质有效
申请号: | 202210478751.9 | 申请日: | 2022-04-30 |
公开(公告)号: | CN114584504B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 王文潇;康英杰;王德奎;陈培 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | H04L45/00 | 分类号: | H04L45/00;G06F15/173 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张艺 |
地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ai 训练 平台 网卡 通信 方法 装置 设备 介质 | ||
1.一种AI训练平台的网卡通信方法,其特征在于,包括:
基于叶脊网络搭建交换机网络拓扑,并为所述交换机网络拓扑中的每一叶交换机配置预设数量个虚拟局域网;
对物理网卡进行虚拟化得到若干数量个虚拟网卡,并按照预设分配规则将所述虚拟网卡分配至相应的作业容器,以及为所述作业容器中的每一所述虚拟网卡分配不同的与所述虚拟局域网对应的子网;
向每一所述作业容器所在的容器组添加相应的子网通信策略路由规则,以便所述作业容器中的所述虚拟网卡基于所述子网通信策略路由规则向其余所述虚拟网卡发送训练数据;
其中,所述向每一所述作业容器所在的容器组添加相应的子网通信策略路由规则,以便所述作业容器中的所述虚拟网卡基于所述子网通信策略路由规则向其余所述虚拟网卡发送训练数据,包括:
获取预先创建的与不同容器组对应的子网通信策略路由规则;向每一所述作业容器所在的容器组添加相应的子网通信策略路由规则,以便基于所述子网通信策略路由规则获取训练数据的源IP地址和目的IP地址,并通过与所述源IP地址对应的虚拟网卡,将所述训练数据发送至与所述源IP地址对应的目标子网网关,然后通过所述目标子网网关将所述训练数据发送至与所述目的IP地址对应的虚拟网卡;
并且,所述获取预先创建的与不同容器组对应的子网通信策略路由规则之前,还包括:基于所述作业容器、初始化容器和基础容器构建容器组;
相应的,所述向每一所述作业容器所在的容器组添加相应的子网通信策略路由规则,包括:向每一所述容器组中的所述初始化容器中添加相应的子网通信策略路由规则;
所述向每一所述容器组中的所述初始化容器中添加相应的子网通信策略路由规则之后,还包括:
确定预先为与每一所述容器组对应的虚拟网卡分配的子网网关;通过每一所述容器组向所述子网网关发送ping命令,并基于所述ping命令将包括所述容器组的物理地址的地址解析协议请求发送至相应的叶交换机,以便所述叶交换机获取所述容器组的IP地址,以及通过脊交换机基于边界网关协议从所述叶交换机中学习到所述IP地址。
2.根据权利要求1所述的AI训练平台的网卡通信方法,其特征在于,还包括:
确定所述叶交换机的预设收敛比,并基于所述预设收敛比确定脊交换机的数量,然后在每一所述叶交换机与每一所述脊交换机之间以及在每一所述叶交换机与每一所述虚拟网卡之间分别建立连接。
3.根据权利要求1所述的AI训练平台的网卡通信方法,其特征在于,所述按照预设分配规则将所述虚拟网卡分配至相应的作业容器,以及为所述作业容器中的每一所述虚拟网卡分配不同的与所述虚拟局域网对应的子网,包括:
基于IP地址管理组件将所述虚拟网卡分配至相应的作业容器,以及基于所述IP地址管理组件为所述作业容器中的每一所述虚拟网卡分配不同的与所述虚拟局域网对应的子网内IP地址和相应的子网网关。
4.根据权利要求1至3任一项所述的AI训练平台的网卡通信方法,其特征在于,还包括:
若在所述交换机网络拓扑中增加预设数量台叶交换机,则向当前已存在的容器组中添加与所述预设数量台叶交换机对应的子网通信策略路由规则,并创建与所述预设数量台叶交换机对应的新容器组,然后向所述新容器组添加相应的子网通信策略路由规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210478751.9/1.html,转载请声明来源钻瓜专利网。