[发明专利]一种基于深度学习的LiDAR点云与光学影像先验级耦合分类方法在审
申请号: | 202010886292.9 | 申请日: | 2020-08-28 |
公开(公告)号: | CN111950658A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 陈焱明;刘小强;李满春;万思达;程亮;陈丹晖;肖一嘉;赵琪琪;陈坚利;陈东 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 南京同泽专利事务所(特殊普通合伙) 32245 | 代理人: | 蔡晶晶 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 lidar 光学 影像 先验 耦合 分类 方法 | ||
1.一种基于深度学习的LiDAR点云与光学影像先验级耦合分类方法,包括以下步骤:
步骤1、对多波段光学影像进行地表覆盖分类,得到各像元的分类类别概率向量p=(p1,p2,...,pk),k表示地表覆盖二维类别的总数;
步骤2、将各像元的分类类别概率向量作为LiDAR点的先验概率特征,赋给最近邻的LiDAR点;
步骤3、采用三维神经网络对已嵌入分类类别概率向量的LiDAR点云进行地表覆盖分类,得到最终的城市三维土地覆盖分类结果。
2.根据权利要求1所述的基于深度学习的LiDAR点云与光学影像先验级耦合分类方法,其特征在于:步骤1中,使用二维深度卷积网络对多波段光学影像进行地表覆盖分类,具体方法如下:
使用计算机视觉邻域的SegNet分类多波段光学影像,SegNet包括编码网络与解码网络,编码网络包含5组编码器,其参数使用VGG-16初始化,每组编码器使用卷积层、批归一化层、ReLU激活层、最大池化层提取特征并降低其扩大感受野;
解码网络通过上采样层、卷积层、批归一化层、ReLU激活层进行低分辨率特征的上采样,得到与原图像大小一致的特征图像;利用最大池化层的索引,上采样得到分辨率变大的稀疏特征,这些稀疏特征经过卷积层、批归一化层、ReLU激活层生成密集特征;
SegNet处理光学影像得到的地表覆盖二维分类结果利用行(r)和列(c)确定的每个像素的位置(r,c),每个位置包含属于各类别的概率向量:
p=(p1,p2,…,pk)
其中,k表示地表覆盖二维类别总共有k类。
3.根据权利要求1所述的基于深度学习的LiDAR点云与光学影像先验级耦合分类方法,其特征在于:所述LiDAR点使用坐标值(x,y,z)表示其位置,利用横坐标x,纵坐标y计算出其对应的栅格数据中的行和列(r′,c′),
其中(X,Y)表示光学影像左上角的坐标,gsd表示光学影像的空间分辨率;
在步骤2中,将像元的分类类别概率向量p=(p1,p2,...,pk)嵌入至对应LiDAR点中,得到重构的含有二维类别概率的LiDAR点数据(x,y,z,p1,p2,...,pk)。
4.根据权利要求1所述的基于深度学习的LiDAR点云与光学影像先验级耦合分类方法,其特征在于:步骤3中,使用三维深度神经网络PointNet++对已嵌入分类类别概率向量的LiDAR点云进行分类。
5.根据权利要求4所述的基于深度学习的LiDAR点云与光学影像先验级耦合分类方法,其特征在于:所述三维深度神经网络PointNet++中,batchsize取值为16,机器学习训练的优化器选择自适应矩估计,损失函数选择加权交叉信息熵损失,学习率使用指数衰减来改变。
6.根据权利要求5所述的基于深度学习的LiDAR点云与光学影像先验级耦合分类方法,其特征在于:所述三维深度神经网络PointNet++中,各类别的权重如下:
低矮植被:0.51,灌丛:1.92,树木:0.68,不透水面:0.47,车辆:19.81,屋顶:0.60,建筑物立面:3.35,其他:0。
7.根据权利要求6所述的基于深度学习的LiDAR点云与光学影像先验级耦合分类方法,其特征在于:所述三维深度神经网络PointNet++中,超参数设置如下:
层类别 参数设置 采样组合层 N=1024,r=2,K=32 特征提取层 [32,32,64] 采样组合层 N=256,r=4,K=32 特征提取层 [64,64,128] 采样组合层 N=64,r=8,K=32 特征提取层 [128,128,256] 采样组合层 N=16,r=16,K=32 特征提取层 [256,256,512] 单点特征提取层 [256,256] 单点特征提取层 [256,256] 单点特征提取层 [256,128] 单点特征提取层 [128,128,128]
其中,N为抽象点数,r为球面邻域半径,K为局部区域最大使用点数,[]中的数为三维深度神经网络PointNet++对应层的多层感知机。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010886292.9/1.html,转载请声明来源钻瓜专利网。