[发明专利]一种针对室内场景RGB-D图像的语义分割方法有效

申请号：	202010758773.1	申请日：	2020-07-31
公开（公告）号：	CN111739037B	公开（公告）日：	2020-12-01
发明（设计）人：	费哲遥;张健;谢天;李月华;朱世强	申请（专利权）人：	之江实验室
主分类号：	G06T7/11	分类号：	G06T7/11;G06T7/50;G06N3/04;G06N3/08
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	贾玉霞
地址：	310023 浙江省杭州市余***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种针对室内场景 rgb 图像语义分割方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种针对室内场景RGB‑D图像的语义分割方法，该方法以Resnet101作为特征提取网络，增加一个与RGB输入并行的深度的输入通道，通过池化运算保证深度图尺寸与RGB通道的特征图一致；并将Resnet101网络的第一个卷积层替换为局部像素预分组卷积模块。该方法改进了传统的RGB语义分割方法，使模型对深度信息敏感，进而提升语义分割效果。

技术领域

本发明涉及计算机图像处理领域，尤其涉及一种针对室内场景RGB-D图像的语义分割方法。

背景技术

语义分割是计算机视觉中非常重要的一个应用，被广泛运用在机器人、自动驾驶、安防监控等诸多领域。目前RGB-D传感器已经相当成熟，它不仅能提供色彩信息，还能提供深度信息。深度信息在色彩边界不明显、纹理特征较弱的场景中，对语义分割有很强的指导作用，而传统的语义分割方法并不能充分利用深度信息。

发明内容

针对现有的RGB图像分割算法无法利用图像深度信息的不足，本发明提出一种针对室内场景RGB-D图像的语义分割方法，以增强图像分割算法的性能，具体技术方案如下：

一种针对室内场景RGB-D图像的语义分割方法，该方法具体包括如下步骤：

S1：构建语义分割模型；

（1）以开源Deeplab v3+模型为基础，对网络结构进行改造：以Resnet101作为特征提取网络，增加一个与RGB输入并行的深度的输入通道，通过池化运算保证深度图尺寸与RGB通道的特征图一致；

（2）将Resnet101网络的第一个卷积层替换为局部像素预分组卷积模块；

所述的局部像素预分组卷积模块的计算方式如下：

（2.1）设该模块的卷积感受野为k×k，通过该模块对应的深度图获取卷积感受野内像素对应的深度值，并通过深度值转化出k×k个点的点云坐标{p_i}，i=1,2,…,k²；