[发明专利]一种基于可靠权重最优传输的图像分类方法在审

申请号：	202010645952.4	申请日：	2020-07-07
公开（公告）号：	CN111814871A	公开（公告）日：	2020-10-23
发明（设计）人：	徐仁军;刘伟明;林九鸣;钱昕玥;胡晓玥;赵胤;何京城;朱子航;何旭;孙诚博;周翔	申请（专利权）人：	浙江大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06K9/46;G06N3/04;G06N3/08
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	刘静
地址：	310058 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于可靠权重最优传输图像分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于可靠权重最优传输的图像分类方法，首先对源域数据进行预处理，使得深度神经网络拟合源域样本图像的样本标签；然后进行图片标注，给目标域数据样本打上伪标签，再进行节点配对，实现源域和目标域中的相关联的图片的配对，最后通过特征提取器和自适应判别器实现自动分析，对图像进行分类。本发明提出了一种利用空间原型信息和域内结构动态测量样本域间差异的子空间可靠性方法。该方法可作为现有领域自适应技术的预处理步骤，大大提高了效率。本发明将收缩子空间可靠性与最优运输策略相结合，可以使深度特征更加明显，增强模型的鲁棒性和有效性。本发明的深度神经网络在各种数据集上工作稳定，性能优于现有方法。

技术领域

本发明涉及图像分类领域，尤其涉及一种基于可靠权重最优传输的图像分类方法。

背景技术

深度学习是计算机视觉领域中的重要方法，通过训练学习样本数据的内在规律和表示层次，在图像分类，目标检测和语义分割等领域被广泛使用。传统监督学习需要大量人工标注数据，非常费时费力。为避免机械重复的贴标签工作，无监督领域自适应(Unsupervised Domain Adaptation,UDA)方法旨在将某个领域学习好的知识或模式应用到到新的不同但相关的领域中，用拥有丰富的监督信息的源域(Source Domain)来提升无标签或者只有少量标签的目标域(Target Domain)模型的性能。其中，最优传输(OptimalTransport)是一种较好的实现域间特征对齐的方法。但是，大多数基于最佳运输的现有工程都忽略了域内结构，仅实现粗略的成对匹配，很容易将分布在聚类边缘或远离对应类中心的目标样本误分类。

对于无监督的领域自适应(UDA)，传统方法是利用域中不变特征训练的方法进行域迁移,相关的域不变特征度量方法有：

a)最大均值差异Maximum Mean Discrepancy(MMD)

最大均值差异(MMD)是目前使用最广泛的一种损失函数，主要用来度量两个不同但相关的分布的距离。两个分布的距离定义为：

H表示这个距离是由φ()将数据映射到再生希尔伯特空间(RKHS)中进行度量的。

b)Correlation Alignment(CORAL)

CORAL的方法，通过对source domain和target domain进行线性变换来将他们各自的的二阶统计量对齐(对齐均值与协方差矩阵)。

表示第j维度下source(target)domain数据中的第i个样本。用C_S(C_T)表示特征的协方差矩阵。|| ||_F为矩阵的Frobenius范数，d为数据维度。

c)相对熵Kullback-Leibler_divergence(KL)

相对熵，又被称为KL散度，是用来衡量两个概率分布之间的不同程度。设P(x),Q(x)是两个概率分布

利用对抗训练(adversarial training)的方法进行域迁移

d)域对抗神经网络Domain-Adversarial Neural Networks(DANN)

DANN提出的体系结构包括一个特征提取器(绿色)和一个标签预测器(蓝色)，它们共同构成一个标准的前馈神经网络。在基于反向传播的训练过程中，通过梯度反转层将梯度乘以一定的负常数，将一个域分类器(红色)连接到特征提取器，实现无监督域自适应。梯度反转确保了两个域上的特征分布是相似的(对于域分类器来说，尽可能难以区分)，从而产生域不变的特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010645952.4/2.html，转载请声明来源钻瓜专利网。

上一篇：基于密母算法的双网耦合拓扑结构设计方法
下一篇：一种用于玻璃的高温溶融观察炉

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于可靠权重最优传输的图像分类方法在审

专利文献下载