[发明专利]一种车辆行驶决策模型的训练方法及装置有效
申请号: | 202010145000.6 | 申请日: | 2020-03-05 |
公开(公告)号: | CN110991095B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 付圣;靳越翔;任冬淳 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;B60W50/00 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车辆 行驶 决策 模型 训练 方法 装置 | ||
1.一种车辆行驶决策模型的训练方法,其特征在于,包括:
将历史数据中的实际环境信息输入到预先训练的第一生成式对抗网络GAN中的第一生成器,得到所述第一生成器输出的虚拟环境信息;
将所述虚拟环境信息输入到所述第一GAN中的第一判别器,使所述第一判别器判断所述虚拟环境信息是否为实际环境信息;
将所述第一判别器判定为实际环境信息的虚拟环境信息作为样本环境信息,并输入到预先训练的第二GAN中的第二生成器,得到所述第二生成器输出的对应于所述样本环境信息的各虚拟行驶决策;
将所述各虚拟行驶决策输入到所述第二GAN中的第二判别器,使所述第二判别器分别判断每个虚拟行驶决策是否与所述样本环境信息相匹配;
将所述第二判别器判定为与所述样本环境信息相匹配的虚拟行驶决策作为样本行驶决策;
将样本环境信息以及与样本环境信息相匹配的样本行驶决策作为标签,对待训练的车辆行驶决策模型进行训练。
2.如权利要求1所述的方法,其特征在于,将历史数据中的实际环境信息输入到预先训练的第一生成式对抗网络GAN中的第一生成器,得到所述第一生成器输出的虚拟环境信息,具体包括:
对历史数据中的实际环境信息加扰;
将加扰后的实际环境信息输入到预先训练的第一GAN中的第一生成器,得到所述第一生成器输出的虚拟环境信息。
3.如权利要求1所述的方法,其特征在于,预先训练所述第一GAN,具体包括:
将历史数据中的实际环境信息输入到待训练的所述第一GAN中的第一生成器,得到待训练的第一生成器输出的虚拟环境信息;
将所述待训练的第一生成器输出的虚拟环境信息输入到待训练的所述第一GAN中的第一判别器,使待训练的第一判别器判断所述待训练的第一生成器输出的虚拟环境信息是否为实际环境信息;
以所述待训练的第一生成器输出的虚拟环境信息被所述待训练的第一判别器判定为实际环境信息的概率最大,且,所述待训练的第一判别器判定所述待训练的第一生成器输出的虚拟环境信息为实际环境信息的概率最小,为训练目标,对所述第一GAN进行训练,直至所述待训练的第一生成器与所述待训练的第一判别器达到纳什平衡。
4.如权利要求1或3所述的方法,其特征在于,预先训练所述第二GAN,具体包括:
将所述第一判别器判定为实际环境信息的虚拟环境信息作为样本环境信息,并输入到待训练的所述第二GAN中的第二生成器,得到待训练的第二生成器输出的对应于所述样本环境信息的各虚拟行驶决策;
将所述待训练的第二生成器输出的对应于所述样本环境信息的各虚拟行驶决策输入到待训练的所述第二GAN中的第二判别器,使待训练的第二判别器分别判断每个虚拟行驶决策是否与所述样本环境信息相匹配;
以所述待训练的第二生成器输出的对应于所述样本环境信息的每个虚拟行驶决策被所述待训练的第二判别器判定为与所述样本环境信息相匹配的概率最大,且,所述待训练的第二判别器判定所述待训练的第二生成器输出的对应于所述样本环境信息的每个虚拟行驶决策与所述样本环境信息是否相匹配的准确率最大,为训练目标,对所述第二GAN进行训练。
5.如权利要求4所述的方法,其特征在于,所述第二判别器用于针对每个虚拟行驶决策,确定该虚拟行驶决策与所述样本环境信息的匹配度,并当该虚拟行驶决策与所述样本环境信息的匹配度大于指定阈值时,判定每个虚拟行驶决策与所述样本环境信息相匹配,当该虚拟行驶决策与所述样本环境信息的匹配度不大于指定阈值时,判定每个虚拟行驶决策与所述样本环境信息不匹配;
对所述第二GAN进行训练,具体包括:
在所述第二GAN进行训练的过程中,当满足指定条件时,将所述指定阈值提高,直到所述指定阈值达到预设阈值为止。
6.如权利要求2所述的方法,其特征在于,所述实际环境信息或者所述虚拟环境信息均包括:公路线路图、交通路线、交通信号灯、车辆的速度、车辆感知的环境中各障碍物的状态信息中的至少一种;
所述虚拟行驶决策包括:车辆位姿。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010145000.6/1.html,转载请声明来源钻瓜专利网。