[发明专利]一种基于局部感知野的单卷积神经网络局部信息与全局信息整合方法有效
申请号: | 201710842145.X | 申请日: | 2017-09-18 |
公开(公告)号: | CN107679539B | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 文戈;蔡登;何晓飞 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 33224 杭州天勤知识产权代理有限公司 | 代理人: | 胡红娟 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征图 卷积神经网络 局部信息 全局信息 分割 感知 网络模型 计算量 分割方式 损失函数 综合考虑 算法 维度 整合 信息量 叠加 匹配 平衡 改造 学习 | ||
本发明公开了一种基于局部感知野的单卷积神经网络局部信息与全局信息整合方法,包括:步骤1,给定卷积神经网络模型,计算每一层特征图对应在原图中的局部感知野大小;步骤2,依据每一层局部感知野大小,选取一个层分割,以平衡局部信息和全局信息;步骤3,综合考虑信息量与计算量,选取分割方式与分割个数,对选取层的特征图进行分割;步骤4,对分割后的特征图进行维度匹配;步骤5,将选取层后面的所有层,包括损失函数层,叠加到每一个分割后的子特征图之后,进行训练。本发明提出的卷积神经网络改造算法能使得在一个网络模型中同时学习得到局部信息与全局信息,提高网络模型表达能力,同时仅产生较少的计算量增加。
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于局部感知野的单卷积神经网络局部信息与全局信息整合方法。
背景技术
2012年,卷积神经网络在ImageNet大规模图像识别比赛中获得冠军,并相比传统算法取得了压倒性的优势。近年来,卷积神经网络越来越多地被应用到计算机视觉的各个领域,包括图像识别、图像检测、图像分割等。
卷积神经网络是由若干卷积层、池化层以及损失函数层等叠加而成的多层神经网络模型。当一张图片输入至卷积神经网络,随着深度的增加,每一层特征图中一个固定大小的区域对应在原图中的局部感知野大小也相应增大。
由于卷积神经网络的结构特性,全局信息能被很好地利用,而局部细节信息通常不易学习得到。为了同时整合局部信息与全局信息,当前,研究者倾向于对原图抽取多个子块,然后分别对每一个图像子块训练一个单独的卷积神经网络模型。在测试阶段,每一张图像及其子块都需经过对应模型抽取特征,然后将所有抽取得到的特征进行取平均或拼接操作,作为该图像的最终特征。但这样的方法存在诸多局限性。1.特征抽取时间会随着模型个数的增加线性增长,特别是测试阶段,过长的特征抽取时间会影响到模型部署后的性能;2.最终准确率的增长会随着模型个数的增加越来越小,通常从一个模型拼接到两个模型的准确率增长会比两个模型到十多个模型的准确率增长更大;3.子块的选择需要大量人工参与,拼接不合适的子块甚至会使最终准确率下降。
发明内容
针对上述现有通过分割原图利用多模型整合局部信息与全局信息方法的局限性,本发明提供了一种基于局部感知野的单卷积神经网络局部信息与全局信息整合方法,能使得在一个网络模型中同时学习得到局部信息与全局信息,提高网络模型表达能力,同时仅产生较少的计算量增加。
一种基于局部感知野的单卷积神经网络局部信息与全局信息整合方法,包括:
步骤1,给定卷积神经网络模型,计算每一层特征图对应在原图中的局部感知野大小;
步骤2,依据每一层局部感知野大小,选取一个层分割,以平衡局部信息和全局信息;
步骤3,综合考虑信息量与计算量,选取分割方式与分割个数,对选取层的特征图进行分割;
步骤4,对分割后的特征图进行维度匹配;
步骤5,将选取层后面的所有层,包括损失函数层,叠加到每一个分割后的子特征图之后,进行训练,完成局部信息与全局信息的整合。
为方便表述,记输入层即图像层为第0层,后续深度为i的层为第i层。
步骤1中,局部感知野大小的计算可以使用逐层迭代的方式:
对于第N层特征图中一个大小为HN*WN的区域,可以依据第N层网络参数如核大小、步长等方便计算得到其对应到第N-1层特征图中的大小HN-1*WN-1,逐层迭代,直至第0层输入层,得到H0*W0,即为所求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710842145.X/2.html,转载请声明来源钻瓜专利网。