[发明专利]一种深度多模态跨层交叉融合方法、终端设备及存储介质有效
申请号: | 202010752038.X | 申请日: | 2020-07-30 |
公开(公告)号: | CN111860425B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 张新钰;李志伟;刘华平;李骏;柯锐 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 李彪;张红生 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 多模态跨层 交叉 融合 方法 终端设备 存储 介质 | ||
1.一种深度多模态跨层交叉融合方法,所述方法包括:
获取包含车道线的RGB图像和点云数据,并进行预处理;
将预处理后的RGB图像和点云数据输入预先构建和训练好的语义分割模型,输出图像分割结果;所述语义分割模型用于实现RGB图像和点云数据的跨层交叉融合;
所述语义分割模型为由点云分支和图像分支组成的SkipCrossNet模型,该模型划分为三个融合单元:
第一融合单元,用于对点云数据和RGB图像进行交叉融合;
第二融合单元,用于进行点云Encoder阶段的特征与图像Encoder阶段的特征融合;和
第三融合单元,用于进行点云Decoder阶段的特征与图像Decoder阶段的特征融合。
2.根据权利要求1所述的深度多模态跨层交叉融合方法,其特征在于,所述RGB图像通过安装在行驶车辆上的前向单目相机或前向单目摄像头获得;该RGB图像包括行驶车辆的行车方向正前方和路面上方的路面图像信息;所述点云数据通过安装在行驶车辆上激光雷达获得;RGB图像和点云数据是同步采集的。
3.根据权利要求1所述的深度多模态跨层交叉融合方法,其特征在于,所述第一融合单元的具体实现过程为:
图像对点云的融合为:
Lidarf=R0*RGB+Lidar
其中,Lidar为获取的点云数据,RGB为获取的RGB图像,Lidarf为融合之后的点云数据,R0为融合参数;
点云对图像的融合为:
RGBf=L0*Lidar+RGB
其中,RGBf为融合之后的图像,L0为融合参数;
将Lidarf和RGBf输出至第二融合单元。
4.根据权利要求3所述的深度多模态跨层交叉融合方法,其特征在于,所述第二融合单元包括N个融合阶段;第一融合阶段的输入为:第一融合子单元输出的Lidarf和RGBf;第i融合阶段的输入为第i-1融合阶段的输出;第N融合阶段的输出为第三融合单元的输入;每个融合阶段的融合次数预先设定;
当一个融合阶段的融合次数为M时,该融合阶段的具体实现过程为:
对于点云分支,将Lidar Block的第一层特征与RGB Block的第一层特征进行融合:
Lidar_LE_Feature2=S11*RGB_LE_Feature1+Lidar_LE_Feature1
其中,Lidar_LE_Feature2表示Lidar Block的第二层特征,Lidar_LE_Feature1表示Lidar Block的第一层特征,即输入该融合阶段的点云特征;RGB_LE_Feature1表示RGBBlock的第一层特征,即输入该融合阶段的图像特征,S11表示RGB Block的第一层特征与Lidar Block的第一层特征的融合参数;
当2≤m≤M-1时,将Lidar Block的第m层特征与RGB Block的前m层所有特征进行融合,得到Lidar Block的第m+1层特征Lidar_LE_Featurem:
其中,RGB_LE_Featurek表示RGB Block的第k层特征,Sk,m表示RGB Block的第k层特征与Lidar Block的第m层特征的融合参数;Lidar_LE_Featurem表示Lidar Block的第m层特征;
对于图像分支,将RGB Block的第一层特征与Lidar Block的第一层特征进行融合:
RGB_LE_Feature2=T11*Lidar_LE_Feature1+RGB_LE_Feature1
其中,RGB_LE_Feature2表示RGB Block的的第二层特征,T11表示Lidar Block的第一层特征与RGB Block的第一层特征的融合参数;
当2≤m≤M-1时,将RGB Block的第m层特征与Lidar Block的前m层所有特征进行融合,得到RGB Block的第m+1层特征RGB_LE_Featurem:
其中,Lidar_LE_Featurek表示Lidar Block的第k层特征,Tk,m表示Lidar Block的第k层特征与RGB Block的第m层特征的融合参数;RGB_LE_Featurem表示RGB Block的第m层特征;
该融合阶段的输出为Lidar_LE_FeatureM和RGB_LE_FeatureM。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010752038.X/1.html,转载请声明来源钻瓜专利网。