[发明专利]用于确定无人车的驾驶行为的方法和装置有效
申请号: | 201710790024.5 | 申请日: | 2017-09-05 |
公开(公告)号: | CN107392189B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 郁浩;闫泳杉;郑超;唐坤;张云飞;姜雨 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 确定 无人 驾驶 行为 方法 装置 | ||
本申请实施例公开了用于确定无人车的驾驶行为的方法和装置。方法的一具体实施方式包括:获取图像传感器采集的原始高清图像;缩放原始高清图像,得到分辨率低于原始高清图像的缩略图;基于注意力模型,确定缩略图中的感兴趣区域;在原始高清图像中,确定感兴趣区域的对应区域;将缩略图和对应区域输入端到端模型,得到端到端模型输出的无人车的驾驶行为。该实施方式提高了端到端模型输出的驾驶行为的准确性。
技术领域
本申请涉及计算机技术领域,具体涉及计算机网络技术领域,尤其涉及用于确定无人车的驾驶行为的方法和装置。
背景技术
在无人驾驶系统中,需要通过图像传感器采集无人驾驶汽车周围的图像,以便确定无人驾驶汽车所处的环境。
目前,在从图像传感器的输入确定无人车的驾驶行为时,通常采用高分辨率的图像传感器来采集无人驾驶汽车的图像,但受限于计算能力、显存等因素制约,无人驾驶系统中需要先将原始的高清图片压缩成低分辨率的缩略图,再采用神经网络来处理低分辨率的图像。
然而,目前的从图像传感器的输入确定车的驾驶行为的方案中,输入神经网络的低分辨率图片,会丢失很多要素的详细信息,导致端到端系统无法准确的预测结果。
发明内容
本申请的目的在于提出一种改进的用于确定无人车的驾驶行为的方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请实施例提供了一种用于确定无人车的驾驶行为的方法,方法包括:获取图像传感器采集的原始高清图像;缩放原始高清图像,得到分辨率低于原始高清图像的缩略图;基于注意力模型,确定缩略图中的感兴趣区域;在原始高清图像中,确定感兴趣区域的对应区域;将缩略图和对应区域输入端到端模型,得到端到端模型输出的无人车的驾驶行为。
在一些实施例中,注意力模型为具备聚焦于图像中感兴趣区域的能力的模型。
在一些实施例中,端到端模型为基于输入图像得到无人车驾驶行为指令的模型。
在一些实施例中,端到端模型为卷积神经网络模型。
在一些实施例中,端到端模型由CNN模型和LSTM模型合成。
在一些实施例中,端到端模型基于采集车采集的实际驾驶行为与采集车上设置的图像传感器采集的视频帧的映射关系训练得到。
第二方面,本申请实施例提供了一种用于确定无人车的驾驶行为的装置,装置包括:高清图像获取单元,用于获取图像传感器采集的原始高清图像;高清图像缩放单元,用于缩放原始高清图像,得到分辨率低于原始高清图像的缩略图;兴趣区域确定单元,用于基于注意力模型,确定缩略图中的感兴趣区域;对应区域确定单元,用于在原始高清图像中,确定感兴趣区域的对应区域;驾驶行为确定单元,用于将缩略图和对应区域输入端到端模型,得到端到端模型输出的无人车的驾驶行为。
在一些实施例中,兴趣区域确定单元中的注意力模型为具备聚焦于图像中感兴趣区域的能力的模型。
在一些实施例中,驾驶行为确定单元中的端到端模型为基于输入图像得到无人车驾驶行为指令的模型。
在一些实施例中,驾驶行为确定单元中的端到端模型为卷积神经网络模型。
在一些实施例中,驾驶行为确定单元中的端到端模型由CNN模型和LSTM模型合成。
在一些实施例中,驾驶行为确定单元中的端到端模型基于采集车采集的实际驾驶行为与采集车上设置的图像传感器采集的视频帧的映射关系训练得到。
第三方面,本申请实施例提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上任意一项用于确定无人车的驾驶行为的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710790024.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种摄录装置
- 下一篇:基于半监督多视图字典学习的彩色人脸识别方法