[发明专利]一种基于RGB-D图像分类问题的对抗度量学习算法在审
申请号: | 202010444044.9 | 申请日: | 2020-05-22 |
公开(公告)号: | CN111488951A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 史颖欢;陈建蓉;高阳 | 申请(专利权)人: | 南京大学;江苏万维艾斯网络智能产业创新中心有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京泰普专利代理事务所(普通合伙) 32360 | 代理人: | 窦贤宇 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 rgb 图像 分类 问题 对抗 度量 学习 算法 | ||
1.一种基于RGB-D图像分类问题的对抗度量学习算法,其特征在于,包括如下步骤:
步骤(1)选取RGB-D图像多视图数据集,并划分训练集和测试集,分别提取数据特征,可以采用传统的手工提取特征或者训练深度网络自动提取特征;
步骤(2)基于数据集获取到的特征,构建特征三元组;
步骤(3)在深度学习框架Pytorch中,构建多视图对抗度量学习模型,其中包含基于特定试图的视图内对抗单元和基于多个视图的视图间对抗单元;
步骤(4)训练多视图对抗度量学习模型,待模型收敛后保存模型参数,学习得到视图内度量距离、视图间度量距离以及视图间转换矩阵,能将原始多个视图特征合成单独一个特征向量表示;
步骤(5)测试模型,利用合成的特征向量进行后续分类/聚类任务。
2.根据权利要求1所述的一种基于RGB-D图像分类问题的对抗度量学习算法,其特征在于,所述步骤(1)特征提取,采用了深度学习的经典VGG模型提取分别提取RGB图像特征和深度图像特征,分别针对RGB和深度视图训练两个单独的VGG模型,对于每个VGG模型都会进行微调以获得最佳性能。模型最后一层全连接层的输出被视为两个不同视图的原始特征,两个视图的特征表示均为4096维。
3.根据权利要求1所述的一种基于RGB-D图像分类问题的对抗度量学习算法,其特征在于,所述步骤(2)构建特征三元组,三元组的被设置为10n,其中n是每个数据集中训练样本的数量。
4.根据权利要求1所述的一种基于RGB-D图像分类问题的对抗度量学习算法,其特征在于,所述步骤(3)在深度学习框架Pytorch中,构建多视图对抗度量学习模型,包含基于特定试图的视图内对抗单元和基于多个视图的视图间对抗单元,视图内对抗单元由视图内生成器和视图内判别器构成,目标是学习视图内度量距离LA和LB,视图间对抗单元由视图间生成器和视图间判别器构成,目标是学习视图间度量距离LAB以及转换矩阵TA和TB,其中A和B代表两个视图。
5.根据权利要求4所述的一种基于RGB-D图像分类问题的对抗度量学习算法,其特征在于,所述步骤(4)训练模型,使用单位矩阵或大间隔最近邻居分类算法的输出对转化矩阵/度量距离进行初始化。使用梯度下降的方法求解各项梯度,依次更新LA、LB、LAB、TA和TB直到收敛。
6.根据权利要求5所述的一种基于RGB-D图像分类问题的对抗度量学习算法,其特征在于,所述步骤(5)测试模型阶段,利用步骤(4)学习到的度量距离LA、LB、LAB以及转换矩阵TA和TB合成的特征向量进行后续分类/聚类任务。具体来说,对于第i个测试样本可以得到其视图内的表示和视图间的表示这三种表示形式将被合并为一个特征向量,即用于表示当前第i个测试样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学;江苏万维艾斯网络智能产业创新中心有限公司,未经南京大学;江苏万维艾斯网络智能产业创新中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010444044.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种船舶光伏发电并网系统
- 下一篇:一种组装式配电箱
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序