[发明专利]一种基于异向强化学习的分布式数据中心选择方法在审
申请号: | 202011580622.8 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112700269A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 彭志平;李启锐;崔得龙;何杰光 | 申请(专利权)人: | 广东石油化工学院 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06;G06N20/00 |
代理公司: | 广州润禾知识产权代理事务所(普通合伙) 44446 | 代理人: | 林伟斌 |
地址: | 525000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 分布式 数据中心 选择 方法 | ||
1.一种基于异向强化学习的分布式数据中心选择方法,其特征在于,包括:
获取数据中心信息和用户信息;所述数据中心信息包括:数据中心位置信息和数据中心计费信息;所述用户信息包括:用户位置信息和用户需求信息;
收集训练样本,建立训练集;所述训练样本用于存储数据中心位置信息、数据中心计费信息和回报值;所述回报值为奖赏函数通过数据中心信息和用户位置信息计算获取的值;
根据训练样本优化选择器;
通过优化后的选择器选择数据中心。
2.根据权利要求1所述的一种基于异向强化学习的分布式数据中心选择方法,其特征在于,所述选择器的目标函数为:
所述u为用户;所述vi为租用的数据中心;所述G为点线图,G=(V(G),E(G));所述V(G)为地图G中所有的数据中心,|V(G)|=n;所述E(G)为地图G中所有的数据中心之间的边,|E(G)|=m;所述边为数据中心之间或数据中心与用户之间的连接路径;所述所述c(vi)为租用的数据中心vi的费用。
3.根据权利要求2所述的一种基于异向强化学习的分布式数据中心选择方法,其特征在于,所述所述为租用数据中心vi的网络资源费用;所述t(vi)为租用数据中心vi的计算资源费用。
4.根据权利要求3所述的一种基于异向强化学习的分布式数据中心选择方法,其特征在于,所述所述为设置了用户位置信息的点线图G;所述f(·)为边价值函数;为用户u与数据中心vi之间最短的边。
5.根据权利要求4所述的一种基于异向强化学习的分布式数据中心选择方法,其特征在于,所述所述|ei,j|为vi和vj之间的距离;所述vj为用户u;所述traffic为数据中心vi的单位流量价格;所述d为租赁的带宽。
6.根据权利要求5所述的一种基于异向强化学习的分布式数据中心选择方法,其特征在于,所述t(vi)=a*pi+b*mi+c*di;所述a为数据中心vi的虚拟机CPU的计算能力;pi为租用数据中心vi的虚拟机CPU的单位价格;所述b为数据中心vi的虚拟机内存的大小;所述mi为租用数据中心vi的虚拟机内存的单位价格;所述c为数据中心vi的虚拟机的外存大小;所述di为租用数据中心vi的虚拟机外存的单位价格。
7.根据权利要求6所述的一种基于异向强化学习的分布式数据中心选择方法,其特征在于,所述训练样本为(St,α,r,St+1);所述St和St+1分别为时间步t和时间步t+1的状态;所述状态为代表数据中心位置和用户位置的编号,由状态空间S存储,S={0,1,2,……,n-1,n};所述α为时间步t的采取的动作;所述动作为代表拟传输数据的数据中心位置和用户位置的编号,由动作空间A存储,A={0,1,2,……,n-1,n};所述编号0,1,2,……,n-1代表数据中心位置;所述编号n代表用户位置;所述r为时间步t采取动作α得到的回报值,由奖赏函数计算获取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东石油化工学院,未经广东石油化工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011580622.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于安装和固定的喷泉水泵
- 下一篇:快速制备导电炭设备