[发明专利]一种基于空间融合池化的深度神经网络方法有效

专利信息
申请号: 201710619831.0 申请日: 2017-07-26
公开(公告)号: CN107506822B 公开(公告)日: 2021-02-19
发明(设计)人: 庞彦伟;李亚钊 申请(专利权)人: 天津大学
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08;G06K9/62
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 程毓英
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 空间 融合 深度 神经网络 方法
【说明书】:

本发明涉及一种基于空间融合池化的深度神经网络方法,用于图像分类,包括:收集各种不同类别的图像,并标注图像类别,作为图像标签信息;图像集划分;将收集的图像划分为训练集,验证集和测试集,训练集用于训练卷积神经网络;设计应用于图像分类的深度神经网络结构,包括所用的卷积层层数和空间融合池化层的层数,设计卷积层中滤波器的个数,设计空间融合池化层的中的融合函数形式和空间滑动步长和池化函数和池化窗口尺寸以及步长,设计用于特征融合的卷积滤波器结构,设计网络训练循环迭代的次数和网络最终收敛条件,并初始化网络参数;将训练数据批量的输入到该网络中,进行计算和训练。

技术领域

本发明涉及计算机视觉领域中高性能的图像识别分类和物体识别的方法,特别是涉及采用深度学习方法的图像识别分类和物体识别的方法。

背景技术

近年来,深度学习技术广泛的应用于计算机视觉领域的图像分类、语义分割和物体检测以及自动驾驶等多个任务上。作为深度学习技术中重要的实现方法,深度卷积神经网络在众多任务上取得了显著的效果。

深度卷积神经网络往往由多层卷积层和池化层组成,其中卷积层包含滤波器参数用于提取特征,池化层用于保持神经网络的平移不变性,减少数据扰动对神经网络性能产生的影响,并实现对输入特征的选择和采样。深度卷积神经网络的卷积层通常设有多个卷积核,输出多张特征图(也称为多个通道),因此池化层的输入也具有多个通道。

在深度卷积神经网络中,传统的池化操作是通过对输入特征的某个正方形邻域进行特征采样,来达到维度降低和保持平移不变性。传统的池化操作是对单特征图分别处理,即正方形邻域是在单特征图上进行滑动选取。如较为简单的最大值池化,通过在正方形邻域内选择特征值最大的特征作为池化输出,均值池化则通过求取邻域内特征值的平均值作为池化输出。改进的池化操作,如随机池化[1]则根据邻域各个特征值大小设定的概率值,随机选择某个特征值进行输出,起到了一定的正则化的作用,提升了网络的性能。[2]提出通过学习一个池化函数来实现对传统的多种池化方法的组合,是一种混合的方法,有助于提升特征的多样性,选择更具有代表性的特征。基于频域变换的方法[3],提出将特征图变换到频域,并在频域进行特征选取,通过削减能量占比较小的高频成分,保留能量较大的低频成分,使得大部分特征信息得到保持。

虽然上述提到的池化方法,使得深度卷积神经网络性能得到了一定的提升,但是仍然存在一定缺陷。传统的池化操作是在单张特征图上进行采样,并未利用各特征图之间的通道信息,也就是说存在空间信息损失。此外,传统的池化操作只是对特征进行采样,并未涉及到特征融合,进一步的特征融合将有助于提升池化的效果,得到更具表达力,更稳定的特征。由于传统池化操作是对各个通道分别进行操作,所以池化操作前后,特征通道数保持不变,单特征通道的维度因为特征采样而降低。随着深度卷积神经网络的广泛应用,对于处理能力较弱的硬件,降低网络复杂度同时保持网络性能,成为改进网络结构需要解决的问题。因此,通过池化操作得到更具表达力的少数特征,有助于提升网络效率。

对比以上方法存在的缺陷,本专利提出一种基于空间融合池化的深度神经网络方法,用于融合并提取更具表达力的特征,进一步提升深度卷积神经网络的性能。在降低各特征图维度的同时,通过降低特征通道数以提升网络效率。以图像识别分类任务为例:首先,输入的图像数据经过深度神经网络的卷积层用于提取层次特征。之后,将卷积层特征输入到空间信息融合池化层,该池化层先将利用特征通道信息,将各特征通道进行融合,在此基础上进行进一步的特征采样。通过迭代的对深度神经网络进行训练,得到最后的网络模型。最后,应用该模型进行图像识别和分类。

参考文献:

[1]M.Zeiler and R.Fergus,“Stochastic pooling for regularization ofdeep convolutional neural networks,”In Proc.International Conference onLearning Representations,2013.

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710619831.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top