[发明专利]一种针对室内场景RGB-D图像的语义分割方法有效
申请号: | 202010758773.1 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111739037B | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 费哲遥;张健;谢天;李月华;朱世强 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/50;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 贾玉霞 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 室内 场景 rgb 图像 语义 分割 方法 | ||
本发明提供一种针对室内场景RGB‑D图像的语义分割方法,该方法以Resnet101作为特征提取网络,增加一个与RGB输入并行的深度的输入通道,通过池化运算保证深度图尺寸与RGB通道的特征图一致;并将Resnet101网络的第一个卷积层替换为局部像素预分组卷积模块。该方法改进了传统的RGB语义分割方法,使模型对深度信息敏感,进而提升语义分割效果。
技术领域
本发明涉及计算机图像处理领域,尤其涉及一种针对室内场景RGB-D图像的语义分割方法。
背景技术
语义分割是计算机视觉中非常重要的一个应用,被广泛运用在机器人、自动驾驶、安防监控等诸多领域。目前RGB-D传感器已经相当成熟,它不仅能提供色彩信息,还能提供深度信息。深度信息在色彩边界不明显、纹理特征较弱的场景中,对语义分割有很强的指导作用,而传统的语义分割方法并不能充分利用深度信息。
发明内容
针对现有的RGB图像分割算法无法利用图像深度信息的不足,本发明提出一种针对室内场景RGB-D图像的语义分割方法,以增强图像分割算法的性能,具体技术方案如下:
一种针对室内场景RGB-D图像的语义分割方法,该方法具体包括如下步骤:
S1:构建语义分割模型;
(1)以开源Deeplab v3+模型为基础,对网络结构进行改造:以Resnet101作为特征提取网络,增加一个与RGB输入并行的深度的输入通道,通过池化运算保证深度图尺寸与RGB通道的特征图一致;
(2)将Resnet101网络的第一个卷积层替换为局部像素预分组卷积模块;
所述的局部像素预分组卷积模块的计算方式如下:
(2.1)设该模块的卷积感受野为k×k,通过该模块对应的深度图获取卷积感受野内像素对应的深度值,并通过深度值转化出k×k个点的点云坐标{
(2.2)计算k×k个点的协方差矩阵A
其中,T代表转置;
(2.3)计算矩阵A的特征值,最小特征值对应的特征向量即是与k×k个点的距离之和最小的平面的法向量;
(2.4)计算各个点在方向的投影
(2.5)以卷积核中心点的深度值为零点,计算其他各点与中心点的有向距离
(2.6)以s为宽度,划分出k个深度区间[-(k+2)s/2+js, -(k+2)s/2+(j+1)s]j, j=1,2,…,k;
(2.7)将各点与中心点的有向距离
(3)将Resnet101网络输出的特征图输入Deeplab v3+的解码器解码后输出分类得分图;
S2:选择开源RGB-D语义分割数据集,用反向传播算法训练S1得到的语义分割模型;
S3:将测试RGB-D图像输入S2训练好的语义分割模型中,根据输出的分类得分图计算各像素点类别,输出语义分割图像。
进一步地,所述的解码器的计算过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010758773.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种一体化的光伏组件封装胶膜
- 下一篇:一种智能无线组网多频段汇聚的方法