[发明专利]基于主动学习和变分自编码器的广义零样本目标分类方法有效

专利信息
申请号: 202110459763.2 申请日: 2021-04-27
公开(公告)号: CN113177587B 公开(公告)日: 2023-04-07
发明(设计)人: 李晓;翟之博 申请(专利权)人: 西安电子科技大学
主分类号: G06V10/764 分类号: G06V10/764;G06V10/774;G06V10/82;G06V10/778;G06N3/0455;G06N3/0464;G06N3/091;G06N3/0895
代理公司: 陕西电子工业专利中心 61205 代理人: 陈宏社;王品华
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 主动 学习 编码器 广义 样本 目标 分类 方法
【权利要求书】:

1.一种基于主动学习和变分自编码器的广义零样本目标分类方法,其特征在于,包括如下步骤:

(1)获取训练样本集Ptrain和测试样本集Ptest

将从零样本图像集O中获取的包含ns个已知目标类别的n1幅图像以及每幅已知类别图像的目标类别标签组成的已知类训练样本集Ptrains,和从O中获取的包含nu个未知目标类别的n2幅图像组成未知类训练样本集Ptrainu,组成训练样本集Ptrain,同时将从O中获取的包含nu个未知目标类别的m幅图像组成测试样本集Ptest,其中,ns≥10,n1≥1000,nu≥10,n2≥1000,m≥1000,且n1+n2>m;

(2)构建基于变分自编码器的广义零样本分类模型H:

(2a)构建基于变分自编码器的广义零样本分类模型H的结构:

构建包括变分自编码器f和非线性分类器fclassifier的广义零样本分类模型的结构,其中变分自编码器由并行连接的第一变分自编码器VAE和第二变分自编编码器CVAE组成,VAE由顺次连接的第一编码器f1encoder和第一解码器f1decoder组成,CVAE由顺次连接的第二编码器f2encoder和第二解码器f2decoder组成,非线性分类器fclassifier的输入与第一编码器f1encoder的输出相连;

(2b)定义广义零样本分类模型H的损失函数:

定义广义零样本分类模型H中变分自编码器f的损失函数为L,非线性分类器fclassifier的损失函数LClassifier

L=LVAE+LCVAE+λLDA

其中,LVAE表示第一变分自编码器VAE的损失函数,LCVAE表示第二变分自编编码器CVAE的损失函数,λ表示权重系数,λ∈(0,1),LDA表示VAE和CVAE的对齐损失函数,μ1和μ2分别表示VAE和CVAE输出的隐含分布的均值,σ12和σ22分别表示VAE和CVAE输出的方差,||·||2表示向量二范数,||·||Frob表示矩阵的Frobenius范数,LClassifier表示非线性分类器fclassifier的损失函数,KL(·)为概率分布间的Kullback-Leibler散度,N(μ112)表示均值为μ1方差为σ12的正态分布,N(μ222)表示均值为μ2方差为σ22的正态分布,和分别表示VAE和CVAE的重建损失函数,xi表示第i个已知类图像特征,和分别表示VAE和CVAE对xi的重建结果,Σ表示求和操作,yj表示训练样本集Ptrain中第j类样本的标签,pj表示xi被分类为yj的概率;

(3)对基于变分自编码器的广义零样本分类模型H中的变分自编码器f和非线性分类器fclassifier进行迭代训练:

(3a)将训练样本集Ptrain作为残差网络模型的输入进行特征提取,得到已知类训练样本集Ptrains对应的图像特征集和未知类训练样本集Ptrainu对应的图像特征集

(3b)初始化迭代次数为q,最大迭代次数为Q,Q≥30,并令q=1;

(3c)将图像特征集P'trains作为广义零样本分类模型H的输入,变分自编码器f中的第一变分自编码器VAE所包含的第一编码器f1encoder对每个已知类图像特征xi进行编码,得到隐含分布的均值和方差非线性分类器fclassifier对进行分类,得到已知类图像特征xi所属各类的概率CVAE所包含的第二编码器f2encoder对每个已知类图像特征xi和特征标签yi进行编码,得到隐含分布的均值和方差

(3d)第一解码器f1decoder对隐含变量进行解码,得到第一图像重建特征同时第二解码器f2decoder对隐含变量进行解码,得到第二图像重建特征其中,z1和z2表示从随机高斯分布z~N(0,1)中采样得到的高斯噪声;

(3e)采用变分自编码器f的损失函数为L,并通过第一编码器f1encoder编码的和第二编码器f2encoder编码的和以及第一解码器f1decoder解码的和第二解码器f2decoder解码的计算变分自编码器的损失值L*,同时采用非线性分类器fclassifier的损失函数LClassifier,并通过非线性分类器fclassifier的分类结果计算非线性分类器的损失值(3f)采用反向传播法,并通过L*计算L的梯度同时通过计算LClassifier的梯度然后采用梯度下降法,通过和分别对变分自编码器f和非线性分类器fclassifier的权值参数进行更新;

(3g)将图像样本特征集P'trainu作为第一变分自编码器VAE的输入,第一编码器f1encoder对每个未知类图像特征uj进行编码,采用非线性分类器fclassifier对编码结果进行分类,得到uj所属各类的概率

(3h)通过中概率的最大值和次大值计算的不确定性并将ui、和组合为三元组集合的计算公式为:

(3i)对三元组集合S1进行聚类,并对聚类获取的nu个类别中的三元组中的不确定性按照由小到大的顺序进行排列,然后选取每个类别对应的不确定性集合中前nadd个未知类图像特征uj,组成待标注样本集S2,其中nadd>0;

(3j)对S2中的未知类图像特征uj添加标注信息后加入P'trains中,同时从P'trainu中删除S2中的uj,并判断q>Q是否成立,若是,得到训练好的广义零样本分类模型H*,否则,令q=q+1,并执行步骤(3c);

(4)获取广义零样本的目标分类结果:

(4a)将测试样本集Ptest作为残差网络模型的输入进行特征提取,得到未知类测试样本集Ptest的图像特征集P'test={t1,…,tk,…,tm},其中tk为P'test中第k个样本,m为P'test中的样本个数;

(4b)将P'test作为训练好的广义零样本分类模型H*的输入,第一编码器f1encoder对每个未知类图像特征tk进行编码,得到隐含分布的均值非线性分类器fclassifier对进行分类,得到m个测试样本的分类结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110459763.2/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top