[发明专利]动态拓扑网络智能路由方法在审
申请号: | 202111278176.X | 申请日: | 2021-10-30 |
公开(公告)号: | CN114051272A | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 伍元胜;杜俊逸;倪大冬;肖磊;杨佩彤 | 申请(专利权)人: | 西南电子技术研究所(中国电子科技集团公司第十研究所) |
主分类号: | H04W40/02 | 分类号: | H04W40/02;H04W84/18 |
代理公司: | 成飞(集团)公司专利中心 51121 | 代理人: | 郭纯武 |
地址: | 610036 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动态 拓扑 网络 智能 路由 方法 | ||
1.一种动态拓扑网络智能路由方法,具有如下技术特征:
根据动态拓扑网络的动态路由过程,将网络环境状态s定义为当前网络拓扑、链路的可用带宽、当前业务的源节点、当前业务的目的节点和当前业务的带宽,将路由智能体的动作a定义为业务的路径,将环境反馈的奖励定义为算路成功的业务带宽,并将动态拓扑网络的动态路由问题建模为路由智能体通过与网络环境交互学习可最大化网络吞吐量的网络环境状态s到路由智能体动作a的映射的深度强化学习路由问题;
上述路由智能体实现从网络环境状态s到智能动作a的映射,包含路由策略映射与约束算路两个过程:路由策略映射过程以网络环境状态s为输入,以定义为网络拓扑中所有链路权值的路由策略w为输出,实现网络环境状态s到路由策略w的映射;约束算路过程以网络环境状态s和路由策略w为输入,以业务路径,即智能体的动作a为输出,使用约束最短路算法为网络环境状态s中的当前业务,计算满足复杂路由约束的最小权值路径a,实现路由智能体对复杂路由约束的处理;
上述路由智能体使用近端策略优化算法PPO(Proximal Policy Optimization,简称PPO)学习上述路由策略映射过程网络环境状态s到路由策略w的映射关系,并使用图神经网络近似PPO算法的策略函数和值函数,实现路由智能体对网络拓扑特征的自动提取和对动态变化拓扑的自动适应。
2.如权利要求1所述的动态拓扑网络智能路由方法,其特征在于:图神经网络由输入图网络块GNinp、核心图网络块GNcore和输出图网络块Gout串联而成的图网络,其中,图网络块是图网络的基本构建单元,图网络块以图作为输入和输出,实现对输入图的节点、边和全局属性的变换。
3.如权利要求2所述的动态拓扑网络智能路由方法,其特征在于:输入图Ginp作为输入图网络块GNinp的输入,经GNinp处理后输出图G0,G0作为核心图网络块GNcore的输入,经GNcore处理M次后输出图GM,GM作为输出图网络块Gout的输入,经Gout处理后,输出图Gout。
4.如权利要求1所述的动态拓扑网络智能路由方法,其特征在于:图网络块包含边更新函数Φe、节点更新函数Φv和全局属性更新函数Φu3个更新函数,邻边属性聚合函数ρe→v、点属性聚合函数ρe→u和边属性聚合函数ρv→u3个聚合函数,其中,φe,φv,φu3个更新函数分别实现对边属性、节点属性和全局属性的更新,ρe→v,ρe→u,ρv→u3个聚合函数分别实现对节点的所有邻边属性的聚合、图中所有边属性的聚合和图中所有节点属性的聚合。
5.如权利要求4所述的动态拓扑网络智能路由方法,其特征在于:图网络块的计算过程为:首先使用边属性更新函数φe对图中的每条边的属性进行更新,然后,使用邻边属性聚合函数ρe→v对节点的邻边属性进行聚合,再使用节点更新函数φv对图中的每个节点进行更新;最后,使用节点属性聚合函数ρe→u和边属性聚合函数ρv→u对图中的所有节点属性和图中所有边属性分别进行聚合后,使用全局属性更新函数φu更新全局属性。
6.如权利要求1所述的动态拓扑网络智能路由方法,其特征在于:图网络由1个或多个图网络块组合而成,每个图网络块相当于传统神经网络中的层,对应传统的多层感知机多个图网络块以序列方式组合,或对应传统的递归神经网络以递归的方式组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南电子技术研究所(中国电子科技集团公司第十研究所),未经西南电子技术研究所(中国电子科技集团公司第十研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111278176.X/1.html,转载请声明来源钻瓜专利网。