[发明专利]控制无人驾驶设备及模型训练的方法、装置及电子设备有效
申请号: | 201910154597.8 | 申请日: | 2019-03-01 |
公开(公告)号: | CN109976153B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 穆荣均;夏华夏;任冬淳;郭潇阳;付圣 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 控制 无人驾驶 设备 模型 训练 方法 装置 电子设备 | ||
1.一种控制无人驾驶设备的方法,其特征在于,所述方法包括:
获取目标设备当前的控制指导数据;所述当前的控制指导数据包括所述目标设备当前的运行速度以及当前准备施加的加速度;
获取预先确定的所述目标设备对应的目标隐变量;所述目标隐变量用于表示针对所述目标设备,控制指导数据与控制参数之间的转化影响因素;
基于所述当前的控制指导数据及所述目标隐变量,得到当前的控制参数;
根据所述当前的控制参数控制所述目标设备;
其中,预先通过如下方式确定所述目标隐变量:
确定针对所述目标设备采集的多组样本数据,每组所述样本数据包括控制指导数据及控制参数;
将所述多组样本数据输入目标卷积神经网络,得到所述目标卷积神经网络输出的所述目标隐变量;
所述基于所述当前的控制指导数据及所述目标隐变量,得到当前的控制参数,包括:
将所述当前的控制指导数据及所述目标隐变量输入至目标循环神经网络,得到当前的控制参数。
2.根据权利要求1所述的方法,其特征在于,所述目标卷积神经网络及所述目标循环神经网络通过如下方法训练而成:
执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据;将所述第一数据输入至当前的卷积神经网络,得到隐变量,所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素;将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数;
若基于所述预测参数与所述第二数据对应的控制参数,确定未满足预设条件,对所述卷积神经网络和所述循环神经网络的网络参数进行调整,并重新执行所述目标操作;
若基于所述预测参数与所述第二数据对应的控制参数,确定满足所述预设条件,输出经过调整后的目标卷积神经网络及目标循环神经网络。
3.根据权利要求2所述的方法,其特征在于,所述第一数据和所述第二数据为针对同一无人驾驶设备而采集的数据;
所述目标操作还包括:
在将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络的同时,将随机生成的噪声信号也输入至当前的循环神经网络。
4.根据权利要求2所述的方法,其特征在于,通过如下方式确定满足所述预设条件:
确定目标函数,所述目标函数为所述预测参数与所述第二数据对应的控制参数之间的ELBO证据下线函数;
当所述目标函数收敛时,确定满足所述预设条件。
5.一种用于控制无人驾驶设备的模型训练方法,其特征在于,所述方法包括:
执行以下目标操作:从样本集中选多组样本数据作为第一数据,以及选一组样本数据作为第二数据,每组所述样本数据包括控制指导数据及控制参数;将所述第一数据输入至当前的卷积神经网络,得到隐变量,所述隐变量用于表示控制指导数据与控制参数之间的转化影响因素;将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络,得到预测参数;所述控制指导数据包括当前的运行速度以及当前准备施加的加速度;
若基于所述预测参数与所述第二数据对应的控制参数,确定未满足预设条件,对所述卷积神经网络和所述循环神经网络的网络参数进行调整,并重新执行所述目标操作;
若基于所述预测参数与所述第二数据对应的控制参数,确定满足所述预设条件,输出经过调整后的目标卷积神经网络及目标循环神经网络。
6.根据权利要求5所述的方法,其特征在于,所述第一数据和所述第二数据为针对同一无人驾驶设备而采集的数据;
所述目标操作还包括:
在将所述隐变量和所述第二数据对应的控制指导数据输入至当前的循环神经网络的同时,将随机生成的噪声信号也输入至当前的循环神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910154597.8/1.html,转载请声明来源钻瓜专利网。