[发明专利]一种无人车控制模型的训练方法及装置有效
申请号: | 202010184383.8 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111046981B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 任冬淳;夏华夏;樊明宇;丁曙光;钱德恒 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G05D1/02 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书公开了一种无人车控制模型的训练方法及装置,针对模型训练时的每个时刻,可确定由上一时刻用于计算奖励的各历史环境特征以及根据当前环境信息确定的当前环境特征构成的特征矩阵,之后,再基于当前环境特征以及各历史环境特征对特征矩阵的重要程度,从特征矩阵中选择当前时刻用于计算奖励的特征,然后根据当前环境特征以及选择出的特征确定奖励,以训练该无人车控制模型,并在训练结束后,根据训练完成的模型进行无人车控制。由于计算奖励的特征,是基于包含历史环境特征在内的各特征对的特征对整体的重要程度确定的,使得训练时可基于环境信息的变化确定更多的有效奖励,解决了奖励稀疏的问题,节省了成本以及时间。 | ||
搜索关键词: | 一种 无人 控制 模型 训练 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010184383.8/,转载请声明来源钻瓜专利网。