[发明专利]一种基于增强型栈式自动编码器的自动图像标注方法有效
申请号: | 201610035975.7 | 申请日: | 2016-01-20 |
公开(公告)号: | CN105678340B | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 柯逍;周铭柯;杜明智 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 增强 型栈式 自动 编码器 图像 标注 方法 | ||
本发明涉及一种基于增强型栈式自动编码器的自动图像标注方法:针对深度学习中传统SAE模型难以有效训练有偏数据集的问题,提出一种提升低频标签准确率的平衡栈式自动编码器,较好地改善低频标签的标注效果。然后针对单个B‑SAE模型不稳定导致标注效果易随参数改变而发生较大变化的问题,提出一种针对图像标注任务的增强平衡栈式自动编码器,通过分组按序训练、加权累加各组最优B‑SAE子模型,取得稳定的标注结果。该方法通过逐层预训练权值并用后向传播算法整体调优,改善了传统浅层模型泛化能力弱、难以收敛到最佳极值点等问题,并在训练过程中加强弱标签样本的训练,提升了整个模型的标注效果,该方法简单灵活,具有较强的实用性。
技术领域
本发明涉及模式识别与计算机视觉领域,特别是一种基于增强型栈式自动编码器的自动图像标注方法。
背景技术
随着多媒体影像技术快速发展,互联网上图像信息呈爆炸性增长。这些数字图像的应用非常广泛,如商业、新闻媒体、医学、教育等方面。因此,如何帮助用户快速、准确地找到需要的图像成为近年来多媒体研究的热点课题之一。而解决这一课题最重要的技术就是图像检索和自动图像标注技术。
自动图像标注是指自动给图像添加若干关键词来表示图像的语义内容。自动图像标注可以利用已标注的图像集,自动学习语义概念空间与视觉特征空间的关系模型,并用此模型标注未知语义的图像。一方面,自动图像标注试图给高层语义特征和底层视觉特征之间建立一座桥梁,因此,它可以一定程度解决大多数基于内容图像检索方法存在的语义鸿沟问题,并且具有较好的客观性。另一方面,自动图像标注可以生成与图像内容相关的文字信息,具有更好的准确性。如果能实现自动图像标注,那么现有的图像检索问题实际上可以转化成较成熟的文本检索问题。因此,图像自动标注技术可以很方便地实现基于关键字的图像检索,符合人们的检索习惯。总的来说,自动图像标注涉及计算机视觉、机器学习、信息检索等多方而的内容,具有很强的研究价值和潜在的商业应用,如图像分类、图像检索、图像理解以及智能图像分析等。
根据现有自动图像标注方法的主要实现特点,可以分为两类:基于概率统计的标注方法和基于机器学习的标注方法。基于概率统计的方法虽然可以很方便的扩展到大数据集,但总体标注效果不够理想。基于机器学习的方法,一旦模型训练完毕,就可以进行快速标注,而当前多数分类、回归等学习方法为浅层结构算法,针对复杂分类问题其泛化能力受到一定制约。近年来,深度学习作为机器学习的革新算法,广泛用于目标识别、图像分类、语音识别及其它领域,但鲜有在图像标注问题上得到应用。由于深度学习可以训练深层、复杂的模型,在处理大数据问题上有很大优势。DBN和CNN这两个模型在标签较少、特征简单、特征完整的识别任务中可以取得较好效果,而图像标注问题标签众多、图像特征多样且复杂,且现实图像中还存在大量各类文本、网址、二维码以及图像水印等噪声问题,极大地影响了DBN和CNN的应用效果。而SAE网络,更加注重特征间的近似表达,容易调整模型将复杂的输入表达为理想的输出并应用于特定情形,因此,本专利选用SAE模型解决图像标注问题。
发明内容
本发明的目的在于提供一种基于增强型栈式自动编码器的自动图像标注方法,以克服现有技术中存在的缺陷,解决针对多对象多标签的自动图像标注问题。
为实现上述目的,本发明的技术方案是:一种基于增强型栈式自动编码器的自动图像标注方法,按照如下步骤实现:
步骤S1:构建栈式自动编码器模型,在所述栈式自动编码器模型上判别弱标签样本,并添加噪声以增加所述弱标签样本的训练次数,进而构建平衡栈式自动编码器模型;
步骤S2:通过所述平衡栈式自动编码器模型对训练图像分组训练子平衡栈式自动编码器模型,加权累加各组最优子模型得到增强平衡栈式自动编码器模型;
步骤S3:将未知图像输入到所述增强平衡栈式自动编码器模型并输出标注结果。
在本发明一实施例中,在所述步骤S1中,还包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610035975.7/2.html,转载请声明来源钻瓜专利网。