[发明专利]一种施工升降机的控制系统、方法、装置及存储介质有效
申请号: | 202110625076.3 | 申请日: | 2021-06-04 |
公开(公告)号: | CN113479727B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 蔡长青 | 申请(专利权)人: | 广州大学 |
主分类号: | B66B1/06 | 分类号: | B66B1/06;B66B1/34;B66B1/46 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黎扬鹏 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 施工 升降机 控制系统 方法 装置 存储 介质 | ||
1.一种施工升降机的控制系统,其特征在于,包括远程寻呼机、中央组控制器、中央服务器、传感器和自动控制器;
所述远程寻呼机用于获取第一信息,并将所述第一信息传送至所述中央服务器,所述第一信息包括呼叫信号和呼叫楼层信息;
所述传感器用于检测施工升降机当前状态,并将所述施工升降机当前状态传送至所述中央服务器,所述施工升降机当前状态包括所述施工升降机的当前重量、当前位置、当前运行方向和当前运行速度;
所述中央服务器用于识别所述第一信息和所述施工升降机当前状态,并将所述第一信息和所述施工升降机当前状态传送至所述中央组控制器;
所述中央组控制器用于根据所述第一信息和所述施工升降机当前状态,利用DQN算法得到最优控制策略,并根据所述最优控制策略向所述自动控制器发送控制命令;
所述自动控制器用于接收所述控制命令,并根据所述控制命令控制所述施工升降机的动作;
所述DQN算法为将强化学习与人工神经网络相结合的算法,在更新所述人工神经网络时,使用损失函数计算预测值和实际值之间的差值;其中,
所述预测值表示为:Ws=Q(st,at|θ);式中,Ws表示预测值,Q(st,at|θ)表示实际值,θ表示神经网络的参数,st是施工升降机在时间t时的状态,at是施工升降机在时间t时的动作;
所述实际值表示为:式中,/表示实际值,r表示激励,γ表示折扣系数,/表示更新的实际值,/表示神经网络的参数θ的共轭,st是施工升降机在时间t时的状态,at是施工升降机在时间t时的动作,st+1是施工升降机在时间t+1时的状态,at+1是施工升降机在时间t+1时的动作;
所述损失函数表示为:式中,L(θ)表示损失函数,/表示指数损失函数,D表示范围,st是施工升降机在时间t时的状态,at是施工升降机在时间t时的动作,st+1是施工升降机在时间t+1时的状态,at+1是施工升降机在时间t+1时的动作,r表示激励,γ表示折扣系数,/表示更新的实际值,θ表示神经网络的参数,/表示神经网络的参数的共轭,/表示实际值。
2.根据权利要求1所述的一种施工升降机的控制系统,其特征在于,所述系统还包括呼叫接收器,
所述中央服务器通过所述呼叫接收器接收所述第一信息。
3.根据权利要求1所述的一种施工升降机的控制系统,其特征在于,所述系统还包括远程发射器,
所述传感器通过所述远程发射器将所述施工升降机当前状态实时发送至所述中央服务器。
4.根据权利要求1所述的一种施工升降机的控制系统,其特征在于,所述中央组控制器包括:
接收模块,用于接收所述第一信息和所述施工升降机当前状态;
DQN算法模块,用于利用DQN算法得到最优控制策略;
发送模块,用于根据所述最优控制策略,向相应的自动控制器发送相应的控制命令。
5.根据权利要求4所述的一种施工升降机的控制系统,其特征在于,所述最优控制策略为在最小化所述施工升降机总运输时间的基础上,使奖励函数的累积值最大化;所述奖励函数表示为:
式中,rt表示奖励函数,kh表示当前在大厅等待的乘客人数,kc表示当前在施工升降机轿厢中等待的乘客人数,thi表示乘客i在大厅的等待时间,tcj表示乘客j在施工升降机轿厢中的等待时间,α和β均表示常量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州大学,未经广州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110625076.3/1.html,转载请声明来源钻瓜专利网。