[发明专利]基于张量分析的全分辨率深度卷积神经网络图像分类方法有效
申请号: | 201910453320.5 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110222754B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 庞彦伟;谢今;李亚钊;张志杰;汪天才 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 张量分析 分辨率 深度 卷积 神经网络 图像 分类 方法 | ||
本发明涉及一种基于张量分析的全分辨率深度卷积神经网络图像分类方法,包括如下步骤:准备训练图像集合及集合中每幅图像的类别标签;设定全分辨率卷积神经网络的层数和计算全分辨率卷积所需要的滤波器参数,用全分辨率卷积得到主干网络;根据图像的大小确定张量分析次数,对张量Y进行张量分析,以逐渐缩小Y并得到核张量Z;将得到的核张量Z进行若干次全连接,对类别向量的每个元素进行Sigmoid运算,实现图像分类;设定整个深度卷积网络训练的损失函数,该损失函数主要衡量神经网络预测分类标签和图像真实标签之间的差别;通过反向传播算法,不断更新网络的权重参数。
技术领域
本发明涉及生物特征识别、人机交互、视频监控、无人驾驶等计算机视觉领域中图像分类方法,主要涉及基于深度卷积神经网络的图像分类方法。
背景技术
图像分类是将给定的图像分成若干预先定义好的类别的过程。预先定义的类别包含行人、汽车、自行车、树木、电脑、飞机、船、鲜花等。图像分类包含特征提取和特征分类两个主要过程。深度卷积神经网络将这两个过程联合起来在一个框架下完成,其性能超越了独立手工特征设计和独立进行分类器设计的方法。需要特别指出的是,通过完成图像分类可以得到深度卷积神经网络的参数(主要是滤波器的参数),以这些参数作为初始参数将该深度卷积网络在物体检测、语义分割等其他任务为目的的图像数据库上重新训练可以得到适合进行这些新任务的网络参数。这个将以图像分类为任务的网络参数更新为以其他任务为目的的参数的过程称为参数微调,简称微调。实际上,大部分的深度卷积神经网络的参数都是从图像分类任务中得到初始参数,然后再在特定任务上进行微调的。因此,研究面向图像分类的深度卷积神经网络至关重要。本发明所提的方法除了可以进行图像分类外,也可以供其他任务进行参数微调。
深度卷积神经网络有两种策略:(1)从网络的输入层到输出层逐渐降低特征图的分辨率同时逐渐提高特征图的通道数,代表性的方法有:AlexNet[1]、VggNet[2]、ResNet[3]、DenseNet[4]等。由于顶层特征图的分辨率很低,导致其对小目标的分类性能较差。(2)从输入层到输出层始终保持各个特征层的分辨率与输入图像的分辨率一样大,这类方法称为全分辨率卷积神经网络。代表性方法有全分辨率残差网络(简称FRRN)[5]和庞彦伟等提出的全分辨率深度卷积神经网络[6]。为了便于叙述,称文献[6]的全分辨率深度卷积神经网络为庞网络,对应英文为PangNet。全分辨率残差网络FRRN[5]只能进行图像语义分割(即对图像每个像素赋予预先定义好的类别标签),但不能直接用来图像分类(即不能赋予整个图像一个预先定义好的类别标签)。与PangNet[6]相比,FRRN[5]对特征图行了一系列的下采样和上采样,其起主要特征提取的卷积运算都是在下采样后的低分辨率特征图上进行的,而该下采样导致了较大程度的信息损失,其后虽然通过上采样得到了全分辨率特征图,但很难将损失信息重建出来。与FRRN相比,PangNet能够完成图像分类。另外,PangNet全程没有进行下采样和上采样,所有卷积运算都是在全分辨率输入图像和特征图上进行的,是真正意义上的全分辨率深度卷积神经网络。
然而,文献[6]在得到全分辨率主干网络后进行分类时,将全分辨率特征图划分成若干区域,然后计算每个区域的平均值,最后对这些平均值进行全连接实现最终的分类。虽然计算平均值的效率很高,但这种方法本质上属于下采样操作,不能充分利用全分辨率特征图提供的大量信息。
参考文献:
[1]A.Krizhevsky,I.Sutskever,andG.E.Hinton,“Imagenet classificationwith deep convolutional neural networks,”Proc.Advances inNeural InformationProcessing Systems,2012.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910453320.5/2.html,转载请声明来源钻瓜专利网。