[发明专利]一种深度多模态跨层交叉融合方法、终端设备及存储介质有效

专利信息
申请号: 202010752038.X 申请日: 2020-07-30
公开(公告)号: CN111860425B 公开(公告)日: 2021-04-09
发明(设计)人: 张新钰;李志伟;刘华平;李骏;柯锐 申请(专利权)人: 清华大学
主分类号: G06K9/00 分类号: G06K9/00;G06K9/34;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京方安思达知识产权代理有限公司 11472 代理人: 李彪;张红生
地址: 100084*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 深度 多模态跨层 交叉 融合 方法 终端设备 存储 介质
【权利要求书】:

1.一种深度多模态跨层交叉融合方法,所述方法包括:

获取包含车道线的RGB图像和点云数据,并进行预处理;

将预处理后的RGB图像和点云数据输入预先构建和训练好的语义分割模型,输出图像分割结果;所述语义分割模型用于实现RGB图像和点云数据的跨层交叉融合;

所述语义分割模型为由点云分支和图像分支组成的SkipCrossNet模型,该模型划分为三个融合单元:

第一融合单元,用于对点云数据和RGB图像进行交叉融合;

第二融合单元,用于进行点云Encoder阶段的特征与图像Encoder阶段的特征融合;和

第三融合单元,用于进行点云Decoder阶段的特征与图像Decoder阶段的特征融合。

2.根据权利要求1所述的深度多模态跨层交叉融合方法,其特征在于,所述RGB图像通过安装在行驶车辆上的前向单目相机或前向单目摄像头获得;该RGB图像包括行驶车辆的行车方向正前方和路面上方的路面图像信息;所述点云数据通过安装在行驶车辆上激光雷达获得;RGB图像和点云数据是同步采集的。

3.根据权利要求1所述的深度多模态跨层交叉融合方法,其特征在于,所述第一融合单元的具体实现过程为:

图像对点云的融合为:

Lidarf=R0*RGB+Lidar

其中,Lidar为获取的点云数据,RGB为获取的RGB图像,Lidarf为融合之后的点云数据,R0为融合参数;

点云对图像的融合为:

RGBf=L0*Lidar+RGB

其中,RGBf为融合之后的图像,L0为融合参数;

将Lidarf和RGBf输出至第二融合单元。

4.根据权利要求3所述的深度多模态跨层交叉融合方法,其特征在于,所述第二融合单元包括N个融合阶段;第一融合阶段的输入为:第一融合子单元输出的Lidarf和RGBf;第i融合阶段的输入为第i-1融合阶段的输出;第N融合阶段的输出为第三融合单元的输入;每个融合阶段的融合次数预先设定;

当一个融合阶段的融合次数为M时,该融合阶段的具体实现过程为:

对于点云分支,将Lidar Block的第一层特征与RGB Block的第一层特征进行融合:

Lidar_LE_Feature2=S11*RGB_LE_Feature1+Lidar_LE_Feature1

其中,Lidar_LE_Feature2表示Lidar Block的第二层特征,Lidar_LE_Feature1表示Lidar Block的第一层特征,即输入该融合阶段的点云特征;RGB_LE_Feature1表示RGBBlock的第一层特征,即输入该融合阶段的图像特征,S11表示RGB Block的第一层特征与Lidar Block的第一层特征的融合参数;

当2≤m≤M-1时,将Lidar Block的第m层特征与RGB Block的前m层所有特征进行融合,得到Lidar Block的第m+1层特征Lidar_LE_Featurem

其中,RGB_LE_Featurek表示RGB Block的第k层特征,Sk,m表示RGB Block的第k层特征与Lidar Block的第m层特征的融合参数;Lidar_LE_Featurem表示Lidar Block的第m层特征;

对于图像分支,将RGB Block的第一层特征与Lidar Block的第一层特征进行融合:

RGB_LE_Feature2=T11*Lidar_LE_Feature1+RGB_LE_Feature1

其中,RGB_LE_Feature2表示RGB Block的的第二层特征,T11表示Lidar Block的第一层特征与RGB Block的第一层特征的融合参数;

当2≤m≤M-1时,将RGB Block的第m层特征与Lidar Block的前m层所有特征进行融合,得到RGB Block的第m+1层特征RGB_LE_Featurem

其中,Lidar_LE_Featurek表示Lidar Block的第k层特征,Tk,m表示Lidar Block的第k层特征与RGB Block的第m层特征的融合参数;RGB_LE_Featurem表示RGB Block的第m层特征;

该融合阶段的输出为Lidar_LE_FeatureM和RGB_LE_FeatureM

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010752038.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top