[发明专利]一种基于增强型栈式自动编码器的自动图像标注方法有效

专利信息
申请号: 201610035975.7 申请日: 2016-01-20
公开(公告)号: CN105678340B 公开(公告)日: 2018-12-25
发明(设计)人: 柯逍;周铭柯;杜明智 申请(专利权)人: 福州大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 蔡学俊
地址: 350108 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于增强型栈式自动编码器的自动图像标注方法:针对深度学习中传统SAE模型难以有效训练有偏数据集的问题,提出一种提升低频标签准确率的平衡栈式自动编码器,较好地改善低频标签的标注效果。然后针对单个B‑SAE模型不稳定导致标注效果易随参数改变而发生较大变化的问题,提出一种针对图像标注任务的增强平衡栈式自动编码器,通过分组按序训练、加权累加各组最优B‑SAE子模型,取得稳定的标注结果。该方法通过逐层预训练权值并用后向传播算法整体调优,改善了传统浅层模型泛化能力弱、难以收敛到最佳极值点等问题,并在训练过程中加强弱标签样本的训练,提升了整个模型的标注效果,该方法简单灵活,具有较强的实用性。
搜索关键词: 一种 基于 增强 型栈式 自动 编码器 图像 标注 方法
【主权项】:
1.一种基于增强型栈式自动编码器的自动图像标注方法,其特征在于,按照如下步骤实现:步骤S1:构建栈式自动编码器模型,在所述栈式自动编码器模型上判别弱标签样本,并添加噪声以增加所述弱标签样本的训练次数,进而构建平衡栈式自动编码器模型;步骤S2:通过所述平衡栈式自动编码器模型对训练图像分组训练子平衡栈式自动编码器模型,加权累加各组最优子模型得到增强平衡栈式自动编码器模型;步骤S3:将未知图像输入到所述增强平衡栈式自动编码器模型并输出标注结果;在所述步骤S1中,还包括如下步骤:步骤S11:定义编码器fθ和解码器gθ';所述编码器fθ将输入图像x转换为隐层表达h,解码器gθ'将所述隐层表达h重构为与所述输入图像x维度一致的向量x';其中,fθ(x)=σ(W·x+b),θ={W,b},W为网络权重,满足W'=WT,b为偏置向量,为激活函数;θ'={W',b'};步骤S12:学习一个函数使输出x'=gθ'(fθ(x))和所述输入图像x近似,且定义损失函数为L(x,x')=(x‑x')2,并通过最小化损失函数进行学习:步骤S13:记用于图像标注的SAE模型有L层,并用序号l∈{1,...,L}表示;用hl表示第l层的输出向量,Wl和bl表示第l层的网络权重和偏置,通过自动编码器对{Wl,bl},l∈{1,...,L}逐层预训练;步骤S14:执行前馈过程并用后向传播算法调优;所述栈式自动编码器模型的前馈操作表述为:hl+1=σ(Wl+1hl+bl+1),l∈{0,...,L‑1};所述栈式自动编码器模型的后向传播算法调优表述为:其中,是多个自动编码器模型的合成函数,而θl为参数{Wl,bl},l∈{1,...,L},损失函数为L(x,y)=(x‑y)2;步骤S15:定义约束变量,令向量C=(c1,c2,...,cM),表示关键词yi在训练集P中出现的次数,表示关键词的平均出现次数;向量C=(c1,c2,...,cM)表示第i幅图像xi的每个关键词Yij,j∈{1,2,...,M}在训练集中出现的次数YC,i=C*Yi;从而得到在图像xi中出现次数最低的关键词为步骤S16:定义Φ(x)函数,所述栈式自动编码器模型在训练过程中对训练样本进行判断,若输入图像x包含低频标签的个数多于k个,则对该输入图像x添加适当的噪声;定义Γ(x)函数,对输入图像x增加训练强度,若该输入图像x所包含标签的出现次数低于预设阈值,则增加训练次数,其中,函数Γ(x)为:其中,α和β为常系数,β用于确定需要加重训练的样本,α用于控制需要加重训练的样本的训练强度;函数Φ(x)为:其中,χ为常系数,用于控制噪声添加的强度,d为图像xi特征的维度,表示图像xi第j个维度的值,Ran(·)为随机数函数;步骤S17:调整优化等式得到平衡栈式自动编码器模型模型;将调整为调整为当模型训练好后,所述平衡栈式自动编码器模型的最后一层的输出即为预测图像的关键词的预测分布D;在所述步骤S2中,还包括如下步骤:步骤S21:分组训练子平衡栈式自动编码器模型模型,将平衡栈式自动编码器模型模型按不同的加噪方式划分不同的组,每一组内根据不同的隐层神经元个数划分子模型t表示平衡栈式自动编码器模型模型采用第t种加噪方式,k表示第k个子B‑SAE模型设置的隐层神经元个数;步骤S22:设置初始权值并计算子平衡栈式自动编码器模型模型模型分类误差率,对训练数据设置权值如下:计算的分类误差率:其中,表示:假设图像xi的真实标签集Yi包含c个关键词,并通过模型预测得到标签集Yi*的个数也为c个,如果Yi=Yi*,则为false,否则为true;步骤S23:计算平衡栈式自动编码器模型模型权重,并更新训练数据权值;根据组内所有子模型的分类误差率,可以得到该组分类误差率最低的模型B‑SAEt以及对应的分类误差率et,计算B‑SAEt的权重:当第t组的模型训练完后,更新训练数据的权值,以获得下一组模型的权重,更新训练数据权值的方式如下:步骤S24:加权累加子平衡栈式自动编码器模型模型得到增强平衡栈式自动编码器模型,当所有组都训练完后,即得到关键词预测分布:
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610035975.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top