[发明专利]在标签含噪情况下基于质量嵌入的图像分类方法及系统有效
申请号: | 201710599924.1 | 申请日: | 2017-07-21 |
公开(公告)号: | CN107463953B | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 张娅;姚江超;王嘉杰;王延峰 | 申请(专利权)人: | 上海媒智科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 31317 上海恒慧知识产权代理事务所(特殊普通合伙) | 代理人: | 徐红银<国际申请>=<国际公布>=<进入 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 情况 基于 质量 嵌入 图像 分类 方法 系统 | ||
本发明提供一种在标签含噪情况下基于质量嵌入的图像分类方法及系统,包括:网络图片标签收集步骤;标签质量因子嵌入步骤:在有监督的图像分类模型中引入标签质量因子,用于控制带噪标签的预测值生成和吸收来自错误标签的误差回传信息;利用最大化对数似然函数,设计加入标签质量因子之后的优化目标函数;网络模型构建步骤:利用深度神经网络对优化目标函数进行建模;网络参数训练步骤:将训练图片和带噪声的标签输入网络模型,使用变种的随机梯度下降法端到端的联动训练模型,同时更新模型参数;图像分类步骤。本发明将图片真实标签、用户提供标签和图片标签质量三个变量统一建模,形成对含噪标签的监督学习,能得到较为准确的图像分类结果。
技术领域
本发明涉及计算机视觉和数据挖掘领域,具体地,特别涉及标签含有噪声情况下的图片标签学习方法及系统。
背景技术
图像识别是人工智能领域的一项基础而重要的任务,其应用跨越了自然科学,医药学,工业等多个领域。随着深度学习的迅猛发展,利用卷积神经网络训练得到的图像分类器获得了空前成功。然而深度学习框架下的图像分类学习依赖于大规模高品质的训练数据,包括清晰的图像和精确的标签。这样的训练数据往往来自于人工收集和标注,这将消耗大量的人力物力,使得处理新领域的图像识别问题变得相对昂贵和低效。
由于网络技术,社交媒体的迅速发展以及人们对网络自媒体的热爱,互联网络中存在数不胜数的图片数据。图片社交平台如Flickr和网易LOFTER拥有近千百万的用户提供的图片数据以及标签信息。如果能将这些图片和标签数据用于深度神经网络模型的训练,将大大提升数据集的种类和数量,帮助深度神经网络更快速的迁移到不同领域的图像识别问题中。
使用互联网用户上传的图片和标签作为训练数据可以很好的解决人工标记数据的局限,但是也会带来相应的问题和挑战。大型人工标记数据集提供的图片数据品质好且标签完备,因此基于此类数据集训练得到的神经网络分类器模型准确率高。相比之下,网络图片以及用户标签存在质量不佳标签不准确的特性。如果利用存在大量噪声的图片标签数据,会大大降低模型的预测可靠度。因此,研究如何充分利用网络图片以及用户提供标签这一取之不尽的数据资源,进行有效的图片标签学习得到了更多的关注。
传统的利用带噪标签进行图片标签学习的方法有设计鲁棒的损失函数、统计查询、模拟噪声特性等等。其中一些方法需要一部分干净的标签数据来辅助训练图像分类器;另外一些尝试建立模型模拟数据噪声的分布,图片中真实标签与用户提供标签之间的差异带来的噪声,却没有考虑的图片质量好坏,以及用户提供标签的准确程度,其分类识别的的效果达不到预期。
发明内容
本发明的目的是克服现有技术的不足,提供一种在标签含噪情况下基于质量嵌入的图像分类方法及系统,以解决现有技术中使用带噪声的标签图片训练图像分类器时不考虑图片标签本身质量的问题。
根据本发明的一个方面,提供一种在标签含噪情况下基于质量嵌入的图像分类方法,包括:
网络图片标签收集步骤:从网络图片分享平台上获取大量图片和用户提供的标签信息,按照所需种类进行过滤和整理,以便用于图像分类器的训练;
标签质量因子嵌入步骤:在有监督的图像分类模型中引入标签质量因子,用于控制带噪标签的预测值生成和吸收来自错误标签的误差回传信息;利用最大化对数似然函数,设计加入标签质量因子之后的优化目标函数;
网络模型构建步骤:利用深度神经网络对优化目标函数进行建模,得到整体网络模型,其包括四个子模型,分别为编码模型、采样模型、解码模型和分类模型;
网络参数训练步骤:将网络图片标签收集步骤得到的训练图片和带噪声的标签输入网络模型构建步骤得到的整体网络模型,使用变种的随机梯度下降法端到端的联动训练上述四个子模型,同时更新四个子模型的模型参数;
图像分类步骤:对于要求分类的新图片,输入至训练好的分类模型,得到对图片真实标签的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海媒智科技有限公司,未经上海媒智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710599924.1/2.html,转载请声明来源钻瓜专利网。