首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]策略生成装置及车辆有效

申请号：	201780091112.4	申请日：	2017-06-02
公开（公告）号：	CN110663073B	公开（公告）日：	2022-02-11
发明（设计）人：	喜住祐纪	申请（专利权）人：	本田技研工业株式会社
主分类号：	G08G1/16	分类号：	G08G1/16;B60W30/10
代理公司：	北京聿宏知识产权代理有限公司 11372	代理人：	吴大建;霍玉娟
地址：	日本***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	策略生成装置车辆
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种策略生成装置，是生成用于决定车辆的自动驾驶中的轨道的策略的装置，其特征在于，具备：

报酬推定器；以及

处理部，其以使通过将车辆的周围的状况和所述车辆的行动输入到所述报酬推定器而得到的报酬的期待值变高的方式生成策略，

所述处理部通过强化学习而生成中间策略，所述强化学习包括通过针对周围的状况应用暂定策略来决定车辆采取的行动、通过将所述周围的状况和所述行动输入到所述报酬推定器来得到报酬的期待值、以及对所述暂定策略进行更新直至所述报酬的期待值超过规定的阈值，

通过针对基于规定的驾驶员的实际的周围的状况应用所述中间策略，决定车辆采取的行动，

判定通过应用所述中间策略而决定的行动与由所述规定的驾驶员进行的实际的行动之间的误差是否为阈值以下，

在所述误差大于所述阈值的情况下，更新所述报酬推定器的报酬，利用具有所述更新后的报酬的所述报酬推定器再次决定所述中间策略，

在所述误差为所述阈值以下的情况下，将所述中间策略设为所述策略。

2.根据权利要求1所述的策略生成装置，其特征在于，所述规定的驾驶员包含无事故驾驶员、出租车驾驶员和受到认定的驾驶熟练者中的至少任一个。

3.一种车辆，是进行自动驾驶的车辆，其特征在于，具备：

存储部，其保存由权利要求1或2所述的策略生成装置生成的策略；以及

控制部，其通过对所述车辆的周围的状况应用所述策略来决定轨道，并按照所述轨道来控制所述车辆的行驶。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于本田技研工业株式会社，未经本田技研工业株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201780091112.4/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G08 信号装置
G08G 交通控制系统
G08G1-00 道路车辆的交通控制系统
G08G1-005 .包括行人导引指示器的
G08G1-01 .检测要统计或要控制的交通运动
G08G1-065 .计算一段道路或停车场上的车辆数的，即比较进出车辆数
G08G1-07 .交通信号控制
G08G1-09 .给出可变交通指令的装置

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top