[发明专利]一种基于多分类器的零样本深海生物图片分类方法有效
申请号: | 201910836905.5 | 申请日: | 2019-09-05 |
公开(公告)号: | CN110717513B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 周智恒;牛畅;尚俊媛;黄俊楚;张鹏宇 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蒋剑明 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分类 样本 深海 生物 图片 方法 | ||
1.一种基于多分类器的零样本深海生物图片分类方法,其特征在于,所述的零样本深海生物图片分类方法包括如下步骤:
利用已知公开数据集或者使用GoogleNet网络提取图片特征形成数据集,通过数据集导入每张图片的图像视觉特征数据、标签及语义描述,其中,所述的数据集由相互不重叠的可见类别数据和不可见类别数据组成,可见类别包含数据丰富的常见海洋生物种类,为模型需要学习的类别,不可见类别包含数据匮乏的深海海洋生物种类,为模型需要辨别的类别,所述的标签即图像的类别信息;
类别具体分类器训练,利用可见类别数据训练,在保留流形结构的基础上,为不同类别建立不同的视觉特征空间到语义空间的映射;
其中,所述的可见类别共CS个,视觉特征数据其中d为视觉特征维度,nS为可见类别样本数,语义其中a为语义维度,每行为一个样本对应的语义向量下标S代表可见类别;
所述的不可见类别共CU个,可见类别和不可见类别无交集,视觉特征数据其中nU为不可见类别样本数,语义每行为一个样本对应的语义向量其中a为语义维度,下标U代表不可见类别;
为每个不可见类别学习一个特定于类别C的映射矩阵d为视觉特征维度,a为语义维度,类别具体分类器模型如下:
上式中,表示矩阵-范数的平方,XST表示XS矩阵的转置,第一项通过映射矩阵WC将数据映射到语义空间,是由原始的语义矩阵变换而来的,对应第C个可见类别,对于中的第C类语义aC不做变换,对于其他类的语义变换为-γaC,γ为超参数,通过对每个类的设置,使视觉特征映射后与自己所属类别的语义距离近,同时与其他类别语义远;第二项为-正则项,约束WC的复杂度,防止模型过拟合;第三项为流形正则项,用于保持本类数据的结构在映射前后不变,其中LC为拉普拉斯矩阵,LC=DC-RC,RC计算如下:
上式中,xi和xj分别表示样本数据的第i行和第j行,即第i个样本和第j个样本,表示和xi属于同一类且是xi的k近邻的样本,而DC是一个对角矩阵,其第m个对角元素为RC第m行的和,即(DC)mm=∑l(RC)ml,λ和β是超参数,用于权衡各项权重;
不可见类类别推断,通过将可见类别与不可见类别语义之间的权重进行迁移,使用可见类别的映射矩阵合成不可见类别的映射矩阵,根据距离得出不可见类别的标签,以达到分类目的。
2.根据权利要求1所述的一种基于多分类器的零样本深海生物图片分类方法,其特征在于,所述的通过数据集导入每张图片的图像特征数据之后,还包括:对图像特征数据进行归一化处理,归一化为[-1,1]之间。
3.根据权利要求1所述的一种基于多分类器的零样本深海生物图片分类方法,其特征在于,为对类别具体分类器模型进行求解,以迭代的方式进行WC的更新,每次更新WC时,固定其他的不变,其中得到类别具体分类器模型关于WC的目标函数,令该目标函数对WC的偏导数为零得到:
其中E为单位阵。
4.根据权利要求1所述的一种基于多分类器的零样本深海生物图片分类方法,其特征在于,所述的不可见类类别推断的过程如下:
将每个不可见类语义表示为可见类的加权组合,即为不可见类语义中第p类样本的语义向量,为第q类可见类语义,αq为加权系数,对应的映射矩阵有类似的权重对应关系,即得到不可见类的类别具体的映射矩阵
对于不可见类别图片x,通过下式计算其投影后与各个类别语义的距离,找出其中距离的最小值,进而得到其对应标签:
经上述处理后可以推断出每一张不可见类别图片的标签,从而实现零样本图片分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910836905.5/1.html,转载请声明来源钻瓜专利网。