[发明专利]一种图像数据多标签分类方法有效
申请号: | 201910339785.8 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110210515B | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 陈刚;谌晨;王皓波;胡天磊;陈珂;寿黎但 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 数据 标签 分类 方法 | ||
本发明公开了一种图像数据多标签分类方法。对输入图像进行分解,利用神经网络提取特征的高次相关性,对标签数据进行分解,利用神经网络提取标签的高次相关性,采用包含多层全连接层的神经网络将输入图像的特征码从输入空间解码到标签空间;构建损失函数,初始化训练参数,采用随机梯度下降方法最小化最终损失函数为目标,训练求解获得最优的训练参数;然后针对待测试的图像数据输入到训练后的模型中进行预测,输出获得标签结果,实现多标签分类。本发明解决了图像数据前人工作不能同时提取标签的二次相关性和多次相关性的问题,降低了由于图像数据太过稀疏带来的预测困难,提高了多标签分类的准确性。
技术领域
本发明涉及机器学习领域中的神经网络,因子分解机,多标签分类方法。
背景技术
随着人工智能的快速发展,单标签分类是最著名的机器学习问题之一,其中每个实例与单个标签相关联。然而,在许多真实世界的应用中,一个实例可能与多个标签相关联。例如,一条新闻可能是关于财务和政治,一个视频可能是关于政府和政策的,一张图片可能包含海滩和树木。因此,多标签分类是个很重要的研究领域。
目前,人们已经对多标签分类有了一定研究,提出了许多方法。多标签分类最关键的挑战在于如何学习标签之间的关联性。为此,人们提出了提取一次相关性,二次相关性和多次相关性。但是目前的方法并不能同时提取标签的二次相关性和多次相关性。
发明内容
为了解决背景技术中存在的问题,本发明提出了一种图像数据多标签分类方法。
本发明所采用的技术方案如下:
步骤一是对输入图像进行分解:对输入图像处理获得图像特征集合,建立输入空间,再将图像特征集合中每个图像特征向量进行两两乘积并求和得到图像分解向量;
步骤一对输入图像进行分解提取到特征的二次相关性,从而提升分类准确性。
步骤二是利用神经网络提取特征的高次相关性:将步骤一得到的图像分解向量输入到包含多层全连接层的神经网络中得到输入图像的特征码;
通过步骤一和步骤二,把输入图像映射到了一个网络隐空间,并得到了输入图像的特征码。这个特征码既包含了输入图像的二次相关性,也包含了输入图像的高次相关性。
步骤三是对标签数据进行分解:对已知的标签数据(每幅图像均已经设置了标签)处理得到标签特征集合,建立标签空间,再将标签特征集合中每个标签特征向量进行两两乘积并求和得到标签分解向量;
通过步骤三对标签数据进行分解提取到标签的二次相关性,从而提升分类准确性。
步骤四是利用神经网络提取标签的高次相关性:将步骤三得到的标签分解向量输入到包含多层全连接层的神经网络中得到标签数据的特征码;
通过步骤三和步骤四,把标签数据映射到了一个网络隐空间,并得到了标签数据的特征码。这个特征码既包含了标签数据的二次相关性,也包含了标签数据的高次相关性。
步骤五是解码:采用包含多层全连接层的神经网络将输入图像的特征码从输入空间解码到标签空间;
本发明的包含多层全连接层的神经网络能很好地将隐空间特征映射到标签空间上,从而很好地进行预测。
本发明的损失函数包含三部分:输入图像和标签数据在隐空间的特征码之间的平方损失,预测标签和真实标签的平方损失和正则项。通过平方损失进行训练,输入图像和标签数据可以很好地映射到同一隐空间,并且在隐空间的特征码会非常接近,预测标签和真实标签也会非常接近。最后加入一项正则项,可降低过拟合带来的负面影响,提高分类准确率。
步骤六是检测:构建损失函数,初始化训练参数,采用随机梯度下降方法最小化最终损失函数为目标,训练求解获得最优的训练参数;然后针对待测试的图像数据输入到训练后的模型中进行预测,输出获得标签结果,实现多标签分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910339785.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置