[发明专利]一种目标检测方法及装置有效
申请号: | 202080005178.9 | 申请日: | 2020-05-13 |
公开(公告)号: | CN112740269B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 李洪敏 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T3/00;G06T5/00;G06T7/90;G06V10/40;G06V10/77;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 方法 装置 | ||
一种目标检测方法及装置,涉及信息处理技术领域,可以应用于自动驾驶或者智能驾驶、车联网等。通过分析图像传感器采集的目标场景的第一图像得到目标场景中的一个或多个第一2D检测框,以及分析激光传感器采集的目标场景的三维点云,得到一个或多个视图(例如BEV和/或PV)下,目标场景的一个或多个第二2D检测框。然后,综合分析一个或多个第一2D检测框的匹配度和置信度,以及一个或多个第二2D检测框的匹配度和置信度,得到目标的2D检测框。最后,基于目标的2D检测框对应的三维点,得到目标的3D模型。通过这样的方法,可以避免由于图像传感器FOV受限或环境因素等导致的目标漏检问题。
技术领域
本申请实施例涉及信息处理技术领域,尤其涉及一种目标检测方法及装置,可以具体应用于自动驾驶、智能驾驶或者车联网等。
背景技术
目标三维(3dimensions,3D)检测是3D感知场景,如自动驾驶、机器人导航等场景中不可或缺的底层技术之一。3D检测要求获得目标准确的位置、结构以及类别等信息。
通常,可以根据图像传感器采集的3D感知场景中的图像,获取图像中包括一个或多个图像特征的一个或多个二维(2dimensions,2D)检测框,然后基于获取的一个或多个2D检测框中的图像特征,得到目标的位置、结构以及类别等信息。
但是,采用上述常规方法,对于位于图像传感器视场(field of view,FOV)以外的目标,则无法获取2D检测框,因而无法得到图像传感器FOV以外的目标的位置、结构以及类别等信息。另外,上述常规方法对于环境因素依赖较大,例如在黑夜、光照不足、目标快速运动等情况下,则无法准确检测到3D感知场景中的目标。
发明内容
本申请提供一种目标检测方法及装置,可以解决目标检测过程中,无法准确检测到目标的问题。
为达到上述目的,本申请实施例采用如下技术方案:
第一方面,提供一种目标检测方法,该方法包括:获取第一图像和三维点云;该第一图像是目标场景的图像,三维点云是目标场景的三维点云;根据第一图像中的图像特征,得到一个或多个第一2D检测框;将三维点云投射到预设视图;该预设视图包括鸟瞰视图BEV和/或前视视图PV;将投射到预设视图的三维点云体素化,得到括一个或多个三维点的多个体素;根据得到的多个体素,得到一个或多个第二2D检测框;基于一个或多个第一2D检测框的匹配度和置信度,以及一个或多个第二2D检测框的匹配度和置信度,得到目标的2D检测框;基于目标的2D检测框对应的三维点,获取目标的3D模型;其中,置信度用于表征对应第一2D检测框或第二2D检测框中包括特征三维点的可靠性。
上述第一方面提供的技术方案,通过分析图像传感器采集的目标场景的第一图像得到目标场景中的一个或多个第一2D检测框,通过分析激光传感器采集的目标场景的三维点云,得到一个或多个视图(例如鸟瞰视图(bird view,BEV)和/或前视视图(perspectiveview,PV))下,目标场景的一个或多个第二2D检测框。然后,综合分析一个或多个第一2D检测框的匹配度和置信度,以及一个或多个第二2D检测框的匹配度和置信度,得到目标的2D检测框。最后,基于目标的2D检测框对应的三维点,得到目标的3D模型。通过这样的方法,可以避免由于图像传感器视场(field of view,FOV)受限或环境因素(例如在黑夜、光照不足、目标快速运动)等导致的目标漏检问题。
在一种可能的实现方式中,上述根据得到的多个体素,得到一个或多个第二2D检测框,包括:根据三维点云与所述体素的映射关系,生成体素图;获取体素图对应的每一个体素的体素特征;该体素特征用于表征体素内预设特征三维点的数量,该体素内是否有预设特征三维点或体素内预设特征三维点的平均坐标中的一个或多个;根据体素图对应的每一个体素的体素特征,将体素图表示为多维张量;获取体素图对应的每一个体素的空间特征;根据每一个体素的空间特征,得到一个或多个第二2D检测框。通过对得到的多个体素进行特征分析,以便根据特征分析结果得到候选的可能包括目标特征的2D检测框,以弥补单纯依靠图像分析造成的漏检测的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080005178.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:证书列表更新方法及装置
- 下一篇:指南针的校准方法、航向测量系统和无人机