[发明专利]一种针对RGB-D图像的语义分割方法及装置在审
申请号: | 201811020264.8 | 申请日: | 2018-09-03 |
公开(公告)号: | CN109271990A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 焦继超;邓中亮;章程;苑立彬;王鑫;吴奇;莫耀凯 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;项京 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分支网络 神经网络 语义分割 样本 深度图像 样本标识 目标标识 输出网络 顺次连接 特征融合 图像训练 网络层 应用 | ||
1.一种针对RGB-D图像的语义分割方法,其特征在于,包括:
获得待语义分割的RGB-D图像,所述RGB-D图像包括:红绿蓝三通道RGB图像和所述RGB图像对应的深度图像;
将所述RGB-D图像所包括的RGB图像和深度图像输入至预先训练的神经网络,得到所述RGB-D图像对应的目标标识图像;其中,所述RGB图像输入至所述神经网络的分支网络组中的一个分支网络层,所述深度图像输入至所述分支网络组中的另一个分支网络层;其中,所述神经网络包括:顺次连接的所述分支网络组、特征融合网络层和输出网络层,所述分支网络组包括作为并列分支的两个分支网络层,每个分支网络层为对输入图像进行特征提取的特征提取层;所述神经网络是根据样本RGB-D图像、所述样本RGB-D图像对应的样本标识图像训练得到,所述样本RGB-D图像包括样本RGB图像和样本深度图像,任一样本RGB-D图像对应的样本标识图像为:该样本RGB-D图像所包括的样本RGB图像对应的语义分割结果。
2.根据权利要求1所述的方法,其特征在于,每个分支网络层包括串行连接的三个卷积模块。
3.根据权利要求2所述的方法,其特征在于,第一分支网络层中每个目标卷积模块的输入内容包括:该目标卷积模块的上一卷积模块的输出内容,以及第二分支网络层中与所述上一卷积模块位置对应的卷积模块的输出内容;
其中,所述第一分支网络层为所述RGB图像所在的分支网络层,所述第二分支网络层为所述深度图像所在的分支网络层,任一目标卷积模块为所述第一分支网络层中除第一个卷积模块以外的卷积模块。
4.根据权利要求1所述的方法,其特征在于,所述特征融合网络层的特征融合方式,包括:
将所述两个分支网络层分别输出的特征图谱的通道对应串联的方式。
5.根据权利要求1所述的方法,其特征在于,所述特征融合网络层和输出网络层通过特征选择网络层相连接;其中,所述特征选择网络层包括:顺次连接的池化子层、第一全连接子层和第二全连接子层;
所述池化子层用于:对所述特征融合网络层输出的融合后的特征图谱进行最大池化计算,得到最大池化的计算结果,并将所述计算结果作为第一组惩罚系数;
所述第一全连接子层用于:将所述第一组惩罚系数和所述第一全连接子层的神经元的权重进行计算,得到第一计算结果,并将所述第一计算结果作为第二组惩罚系数,利用sigmoid激活函数将所述第二组惩罚系数的数值归一化,得到第三组惩罚系数;
所述第二全连接子层用于:将所述第三组惩罚系数和所述第二全连接子层的神经元的权重进行计算,得到第二计算结果,并将所述第二计算结果作为第四组惩罚系数,利用sigmoid激活函数将所述第四组惩罚系数的数值归一化,得到第五组惩罚系数,利用所述第五组惩罚系数对所述融合后的特征图谱进行加权计算,得到第一特征图谱。
6.一种针对RGB-D图像的语义分割装置,其特征在于,包括:
获得模块,用于获得待语义分割的RGB-D图像,所述RGB-D图像包括:红绿蓝三通道RGB图像和所述RGB图像对应的深度图像;
计算模块,用于将所述RGB-D图像所包括的RGB图像和深度图像输入至预先训练的神经网络,得到所述RGB-D图像对应的目标标识图像;其中,所述RGB图像输入至所述神经网络的分支网络组中的一个分支网络层,所述深度图像输入至所述分支网络组中的另一个分支网络层;其中,所述神经网络包括:顺次连接的所述分支网络组、特征融合网络层和输出网络层,所述分支网络组包括作为并列分支的两个分支网络层,每个分支网络层为对输入图像进行特征提取的特征提取层;所述神经网络是根据样本RGB-D图像、所述样本RGB-D图像对应的样本标识图像训练得到,所述样本RGB-D图像包括样本RGB图像和样本深度图像,任一样本RGB-D图像对应的样本标识图像为:该样本RGB-D图像所包括的样本RGB图像对应的语义分割结果。
7.根据权利要求6所述的装置,其特征在于,每个分支网络层包括串行连接的三个卷积模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811020264.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序