[发明专利]一种改进SMOKE的单目视觉3D车辆目标实时检测方法在审
申请号: | 202210781199.0 | 申请日: | 2022-07-01 |
公开(公告)号: | CN115082897A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 杨华;蒋立伟;谷涛涛;檀生辉;吴勇;王东;柴诚;戴兴民;伍旭东 | 申请(专利权)人: | 西安电子科技大学芜湖研究院 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/82;G06V10/764;G06V10/46;G06N3/08;G06N3/04 |
代理公司: | 芜湖思诚知识产权代理有限公司 34138 | 代理人: | 项磊 |
地址: | 241000 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 smoke 目视 车辆 目标 实时 检测 方法 | ||
1.一种改进SMOKE的单目视觉3D车辆目标实时检测方法,其特征在于:包括下列步骤:
步骤一、3D车辆数据采集与标定;
步骤二、数据集制作;
步骤三、构建3D车辆目标检测模型;
该步骤中,3D车辆目标检测模型为改进SMOKE的目标检测模型,包括在DLA-34骨干网络后添加DLAUP与IDAUP形成的DLA-seg骨干网络,DLA-seg骨干网络中使用形变卷积和下采样层组合进行信息提取,并添加注意力机制;
步骤四、检测模型训练与推理;
步骤五、将步骤四中最优的模型嵌入实时系统中,并进行实时检测。
2.根据权利要求1所述的一种改进SMOKE的单目视觉3D车辆目标实时检测方法,其特征在于:所述步骤三中,在进行检测框回归时,改进SMOKE中的损失函数为:其中,Lcls为关键点分类损失,为改进后的3D边界框回归损失,Lchange为改进后的总损失,回归参数为α和β,z是特征图的深度偏移;xc、yc是表示特征图的关键点x和y坐标方向的偏移量;h、w、l是目标尺寸高宽长对应的残差,α是目标旋转角,β为检测框的航向角,检测框的航向角通过上述损失函数直接回归得到。
3.根据权利要求1或2所述的一种改进SMOKE的单目视觉3D车辆目标实时检测方法,其特征在于:所述步骤三中,采集的图像数据与标定数据联合输入模型后,经骨干网络处理后实现关键点分类,并同时进行3D检测框的回归,通过对检测框的导航角和3D坐标进行回归,结合分类得到的关键点实现对3D检测框的预测。
4.根据权利要求1或2所述的一种改进SMOKE的单目视觉3D车辆目标实时检测方法,其特征在于:骨干网络在DLAUP和IDLAUP部分引入注意力机制,在网络结构中添加1个通道注意力模块和1个空间注意力模块,骨干网络中Up1模块在可形变卷积后接入1个通道注意力模块和1个空间注意力模块;Up2模块在可形变卷积后接入1个通道注意力模块和1个空间注意力模块。
5.根据权利要求4所述的一种改进SMOKE的单目视觉3D车辆目标实时检测方法,其特征在于:通道注意力模块中,输入特征图是H×W×C,先分别进行一个全局平均池化和全局最大池化得到两个1×1×C的特征图,然后将这两个特征图分别送入两层的全连接神经网络,对应两个特征图的两层全连接神经网络是共享参数的,再将得到的两个特征图相加,通过激活函数得到归一化的权重系数,然后权重系数再与输入特征图相乘,得到最终输出特征图。
6.根据权利要求4所述的一种改进SMOKE的单目视觉3D车辆目标实时检测方法,其特征在于:空间注意力模块中,输入特征图为H×W×C,分别进行一个通道维度的最大池化和平均池化得到两个H×W×1的特征图,然后将这两个特征图在通道维度拼接起来,现在特征图为H×W×2,然后再经过一个卷积层,降为1个通道,同时保持H、W不变,输出特征图为H×W×1,然后再通过激活函数生成空间权重系数,然后再与输入特征图相乘得到最终特征图。
7.根据权利要求1或2所述的一种改进SMOKE的单目视觉3D车辆目标实时检测方法,其特征在于:步骤二中的数据分为标定数据、标签数据和单目相机RGB图像,按照9∶1划分采集到的关联数据为训练集和测试集;步骤四中,利用步骤二中数据集进行训练测试并获取最优的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学芜湖研究院,未经西安电子科技大学芜湖研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210781199.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种捆草机打包装置
- 下一篇:一种集防潮清洁和抗震功能为一体的组合式配电柜