[发明专利]一种复杂山区铁路线路智能化生成方法有效
申请号: | 202011011062.4 | 申请日: | 2020-09-23 |
公开(公告)号: | CN112231870B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 何庆;高天赐;李子涵;王平;高岩;王启航;李晨钟;王晓明;徐双婷;钱舒月 | 申请(专利权)人: | 西南交通大学 |
主分类号: | G06F30/18 | 分类号: | G06F30/18;G06F30/27;G06F16/29;G06Q10/06;G06Q30/02;G06Q50/08 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 何健雄;廖祥文 |
地址: | 610036*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 山区 铁路 线路 智能化 生成 方法 | ||
1.一种复杂山区铁路线路智能化生成方法,其特征在于:包括以下步骤:
一、环境Environment搭建;
1.1、获取目标区域的设计线路信息;
1.2、利用地理信息系统GIS将研究区域划分为若干个网格;
二、设置环境Environment的各类属性;
2.1、设置智能体Agent的状态State,即智能体Agent在环境Environment中所输出的既有线路;
线路在优化过程中包含N次状态转换步骤,即transition step,则状态空间StateSpace在第i次步骤结束时为Si:
Si={[xi,yi,hi]T|xi∈[0,W],yi∈[0,H]};
式中,i=1,2,…,N;xi和yi代表了平面坐标,hi为智能体在第i次步骤结束时所处的高程;W和H为目标区域网格的最大宽度和高度;当i=1时,智能体处于线路的起点;
2.2、设置智能体Agent的动作Action,即智能体Agent输出的下一步空间线路走向;
每一次的transition step都是通过采用动作Action来完成的,动作空间A表示如下:
A={[Δxi,Δyi,Gi]T|Δxi∈[0,W],Δyi∈[0,H],Gi∈[-Gmax,Gmax]};
式中,Δxi和Δyi为智能体在采取动作时平面横纵坐标的移动量,Gi为状态Si和Si+1之间的纵断面坡度,由于需要满足纵断面限值条件:Gi≤Gmax,Gi的范围设定为[-Gmax,Gmax];
根据Si、Si+1和Ai之间的关系,下一步的状态Si+1计算如下:
Si+1=[xi+1,yi+1,hi+1]=[xi+Δxi,yi+Δy,hi+Gi×li];
式中,为Si、Si+1之间的距离,d为网格边长;
2.3、设置智能体Agent的奖励Reward,即智能体Agent输出线路走向以后,环境Environment给予智能体Agent的反馈;
通过采取动作Ai,智能体的状态从Si过渡到Si+1,此时环境Environment会给予智能体奖励Ri,Ri的表达式如下:
式中,以及分别为线路单位造价、生存状态以及距离线路终点的评价指标;uc,us以及ud为三者的权重系数;
三、采用强化学习中的DDPG来确定线路的最优路径;
3.1、创建一个Memory Buffer来存储从Si过渡到Si+1的transition step的各类属性,包括智能体当前的状态、在此状态下的动作、采取此动作后环境给予智能体的奖励以及采取此动作后智能体到达的下一步状态;
3.2、利用Memory Buffer的存储内容更新DDPG结构参数,从Memory Buffer中随机选择若干个transition step进行训练,首先将计算得到的policy gradient利用随机梯度下降法更新Main-Net中的Actor-Net,然后借助Target Net中的两个神经网络计算TD Error值用于更新Main-Net中的Critic-Net;
3.3、用DDPG优化铁路线路路径,直到线路路径收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南交通大学,未经西南交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011011062.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种混合效果好的搅拌设备
- 下一篇:一种智能农机故障检测装置