[发明专利]一种基于双三元组深度度量学习网络的零样本分类方法有效

专利信息
申请号: 201910300850.6 申请日: 2019-04-15
公开(公告)号: CN110135459B 公开(公告)日: 2023-04-07
发明(设计)人: 冀中;汪海;庞彦伟 申请(专利权)人: 天津大学
主分类号: G06V40/10 分类号: G06V40/10;G06V10/774;G06V10/764;G06V10/82
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 杜文茹
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 三元 深度 度量 学习 网络 样本 分类 方法
【权利要求书】:

1.一种基于双三元组深度度量学习网络的零样本分类方法,首先,利用卷积神经网络提取样本图像视觉特征;利用人工标注的属性特征作为样本语义特征,其特征在于,方法包括训练阶段和测试阶段:训练阶段,首先将训练样本语义特征输入到映射网络,进而输出到视觉空间;在视觉空间中,选择一对属于同一类别的训练样本语义特征和训练样本视觉特征构成正样本对,再选取一个与正样本对不同类别的训练样本语义特征,构成三元组,输入到由语义特征作负样本的三元组网络;同时,选择一对属于同一类别的训练样本语义特征和训练样本视觉特征构成正样本对,再选取一个与正样本对不同类别的训练样本视觉特征,构成三元组,输入到由视觉特征作负样本的三元组网络;最后将由语义特征作负样本的三元组网络和由视觉特征作负样本的三元组网络的输出,输入到双三元组损失函数中计算损失,用以对映射网络、由语义特征作负样本的三元组网络和由视觉特征作负样本的三元组网络进行优化训练,选取得到的由语义特征作负样本的三元组网络中的一个网络作为最终的深度度量学习网络;测试阶段,将测试样本视觉特征输入到训练完成的映射网络中映射网络中的语义特征进行度量,得到的输出分别与不同类别的测试样本语义特征输入到训练得到的深度度量学习网络,深度度量学习网络输出得到测试样本视觉特征与不同类别的测试样本语义特征的相似度,使用最近邻分类器对样本进行分类,其中相似度最大的测试样本语义特征标注的类别作为样本视觉特征的类别;

所述双三元组损失函数l(x,a)表示如下:

其中,s(x,a)代表样本视觉特征和样本语义特征的距离,其中x,a是同类别的样本视觉特征和样本语义特征,a′代表不同类的样本语义特征,x′代表不同类的样本视觉特征,α是正负样本的距离间隔,属于超参数;Ω(Wf),Ω(Wg)是映射网络和深度度量学习网络的正则项,Wf和Wg是映射网络和度量网络的权重,λ是正则项系数,f(·)表示语义特征到视觉特征的映射网络,g(·)表示深度度量学习网络,d(·,·)表示两个特征的欧氏距离。

2.根据权利要求1所述的一种基于双三元组深度度量学习网络的零样本分类方法,其特征在于,具体包括如下步骤:

1)在训练阶段,将样本语义特征通过三层的神经网络映射到视觉空间,把一个h维度的样本语义特征向量转换为和样本视觉特征同维度的d维特征向量,把样本语义特征矩阵作为输入,每一行代表一个类别的样本语义特征向量,h是样本语义特征的维度,k是样本的类别数,经过一个h×l×d的三层神经网络,得到变换后的样本语义特征矩阵:其中l为整数,且hld;

2)在视觉空间中将变换后的样本语义特征矩阵和原有的样本视觉特征矩阵作为输入,d是视觉特征的维度,m是训练样本的数目,X中的每一行代表一个样本视觉特征;经过一个d×p×d的三层神经网络,分别得到二次变换后的样本语义特征矩阵和一次变换后的样本视觉特征矩阵其中p为整数,且0pd;

3)利用到二次变换后的样本语义特征矩阵和一次变换后的样本视觉特征矩阵计算出所有样本语义特征和所有样本视觉的欧氏距离,得到距离矩阵其中dij的元素就代表第i个样本的视觉特征与第j类语义特征的距离;

4)在距离矩阵中,选取同类别的样本语义特征和样本视觉特征作为正样本对,再选取与正样本对不同类的样本语义特征作为负样本,共同输入到一个由语义特征作负样本的三元组网络;

5)同时在距离矩阵中,选取同类别的样本语义特征和样本视觉特征作为正样本对,再选取与正样本对不同类的样本视觉特征作为负样本,共同输入到一个由视觉特征作负样本的三元组网络;

6)使用双三元组损失函数l(x,a)公式作为目标函数,对映射网络、由语义特征作负样本的三元组网络和由视觉特征作负样本的三元组网络进行优化训练;

7)在测试阶段,将测试样本语义特征通过训练好的映射网络映射到视觉空间,然后将测试样本视觉特征和将测试样本语义特征逐一经过深度度量学习网络进行距离度量,使用最近邻分类器对样本进行分类,其中相似度最大的测试样本语义特征标注的类别作为样本视觉特征的类别,在传统零样本分类和广义零样本分类中,分别使用如下公式进行分类:

其中,XU是来自未见类标签集合U的样本视觉特征集合,AU是未见类标签集合U的样本语义特征集合,XT是来自所有类别标签集合T的样本视觉特征集合,AT是所有类别标签集合T的样本的语义特征集合,s(xz,an)代表第z个测试样本的视觉特征xz和第n类测试样本语义特征an的距离,y和t分别代表在传统零样本分类和广义零样本分类下的测试样本的预测标签。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910300850.6/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top