[发明专利]一种基于多分辨率的图像分类方法有效
申请号: | 201711120584.6 | 申请日: | 2017-11-14 |
公开(公告)号: | CN107967484B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 章东平;倪佩青;胡葵;杨力;张香伟 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06F16/583 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 杜立 |
地址: | 315470 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分辨率 图像 分类 方法 | ||
本发明公开了一种基于多分辨率的图像分类方法,其目的在于利用不同的深度神经网络结构解决多分辨率输入问题,利用深度学习技术实现从分类标签集合中找出一个分类标签并把分类标签分配给输入图像的效果。其技术关键在于(1)采用跳过部分池化层的方法来实现多分辨率图像分类;(2)采用指定位置输入的方法来实现多分辨率图像分类。(3)根据卷积网络不同层得到的特征特点不同,对不同层的特征采用不同的利用方式。本发明输入任意一张测试图片到训练好的神经网络模型中,神经网络的输出即为该图片的类别。本发明在不统一输入图片大小的前提下,保持了原图片质量,不增加任何噪声,有效地实现了多分辨率的图像分类。
技术领域
本发明属于图像处理领域,尤其涉及到一种基于多分辨率的图像分类方法。
背景技术
图像的分类作为计算机视觉领域的重要组成部分,能够有效地对图像的内容进行分析,获取图像中的关键信息,并给出正确的判断。图像分类看似是最简单的问题,却又是一个核心问题,其重要性还体现在其它的一些计算机视觉问题,如物体定位和识别、图像内容分割等,对现实的工作生活及社会的发展具有重要的意义。
图像分类关注于全局统计信息,而且对于图像数据,深度学习具有优秀的建模和特征提取能力,已被广泛应用于图像物体分类的理论分析和实际应用。Kong提出基于深度置信网络构建模型,利用方向梯度直方图(Histogram of Oriented Gradient,HOG)算子和特征很好地区分了真实交通场景图像数据中的行人、车辆等,并且模型在光照、姿势、分辨率上都具有非常好的鲁棒性。Bo Yu等通过引入多任务训练机制来提升深度模型性能,明显改善了人脸分类识别效果。Sun Y等基于CNN设计出一个DeepID人脸识别系统在人脸识别挑战带标签的数据库LFW(Labeled Faces in the Wild)上取得99.15%的识别率,首次超越同样数据集上人眼97.5%的识别率,最终通过模型的进一步完善,使DeepID系统拥有非常好的遮挡鲁棒性,这一成果极大地推动了具有巨大实用价值的人脸识别领域的发展。
在大规模视觉识别挑战赛(ILSVRC)2012比赛中,来自多伦多大学的AlexKrizhevsky团队设计出卷积神经网络AlexNet,将测试的top-5error下降到15.3%,而采取传统方法做分类的第二名top-5error为26.2%,深度学习方法明显优于传统方法。此后,不断有更加高效、准确的模型出现,如牛津大学的VGG,谷歌研究院的GoogLe Net等。近年来的优秀模型甚至突破了人眼识别的平均错误率,展示了卷积神经网络在图像分类上的强大优势。
深度卷积神经网络用于图片分类效果明显,但仍存在以下问题:
(1)对于一些不容易分类的需要提取更抽象的图片特征的分类任务而言,如人脸识别、人脸属性识别等,一般的网络结构效果比较差。
(2)目前的趋势是网络越深,卷积神经网络的测试效果越好。但是随着网络的加深,过拟合和网络退化问题显得更加严重。
发明内容
本发明的目的在于针对上述技术的不足,提出一种基于多分辨率的图像分类方法,设计深度卷积神经网络结构,利用深度学习技术实现从分类标签集合中找出一个分类标签并把分类标签分配给输入图像的效果。
本发明采用的技术方案是:
一种基于多分辨率的图像分类方法,包括以下步骤:
步骤1:数据集准备。数据集含N种类别,每类含M种分辨其中W为图片的宽,H为图片的高,M=0,1,2,...n。每种分辨率的图片数量相近。将图片分成训练集和测试集两个部分。
步骤2:制作图片标签。标签表示为l(l∈(1,N)),表示属于第几类。在训练集中,同一类别的图片标签保持一致,不同类别的标签不能相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711120584.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种近似图像的压缩编码方法
- 下一篇:用电计量设备故障分析方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序