[发明专利]策略生成装置及车辆有效
申请号: | 201780091112.4 | 申请日: | 2017-06-02 |
公开(公告)号: | CN110663073B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 喜住祐纪 | 申请(专利权)人: | 本田技研工业株式会社 |
主分类号: | G08G1/16 | 分类号: | G08G1/16;B60W30/10 |
代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 吴大建;霍玉娟 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 策略 生成 装置 车辆 | ||
1.一种策略生成装置,是生成用于决定车辆的自动驾驶中的轨道的策略的装置,其特征在于,具备:
报酬推定器;以及
处理部,其以使通过将车辆的周围的状况和所述车辆的行动输入到所述报酬推定器而得到的报酬的期待值变高的方式生成策略,
所述处理部通过强化学习而生成中间策略,所述强化学习包括通过针对周围的状况应用暂定策略来决定车辆采取的行动、通过将所述周围的状况和所述行动输入到所述报酬推定器来得到报酬的期待值、以及对所述暂定策略进行更新直至所述报酬的期待值超过规定的阈值,
通过针对基于规定的驾驶员的实际的周围的状况应用所述中间策略,决定车辆采取的行动,
判定通过应用所述中间策略而决定的行动与由所述规定的驾驶员进行的实际的行动之间的误差是否为阈值以下,
在所述误差大于所述阈值的情况下,更新所述报酬推定器的报酬,利用具有所述更新后的报酬的所述报酬推定器再次决定所述中间策略,
在所述误差为所述阈值以下的情况下,将所述中间策略设为所述策略。
2.根据权利要求1所述的策略生成装置,其特征在于,所述规定的驾驶员包含无事故驾驶员、出租车驾驶员和受到认定的驾驶熟练者中的至少任一个。
3.一种车辆,是进行自动驾驶的车辆,其特征在于,具备:
存储部,其保存由权利要求1或2所述的策略生成装置生成的策略;以及
控制部,其通过对所述车辆的周围的状况应用所述策略来决定轨道,并按照所述轨道来控制所述车辆的行驶。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于本田技研工业株式会社,未经本田技研工业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780091112.4/1.html,转载请声明来源钻瓜专利网。