[发明专利]局部二值化CNN的处理方法、装置、存储介质及处理器在审
申请号: | 201710720466.2 | 申请日: | 2017-08-21 |
公开(公告)号: | CN107491787A | 公开(公告)日: | 2017-12-19 |
发明(设计)人: | 王志鹏;周文明 | 申请(专利权)人: | 珠海习悦信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04 |
代理公司: | 北京挺立专利事务所(普通合伙)11265 | 代理人: | 倪钜芳 |
地址: | 519080 广东省珠海市高新区唐*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 局部 二值化 cnn 处理 方法 装置 存储 介质 处理器 | ||
技术领域
本发明涉及卷积神经网络领域,具体而言,涉及一种局部二值化CNN的处理方法、装置、存储介质及处理器。
背景技术
随着深度学习的普及,越来越多的卷积神经网络技术进入应用落地阶段。卷积神经网络凭借深层次、高维度的模型架构在图像识别、目标检测、场景分类等多种任务中体现出了优越的性能。然而,在终端平台的本地化应用中,卷积神经网络面临着巨大的挑战,其参数量多、计算复杂,难以适应存储及计算资源受限的嵌入式终端平台。
近年来,低精度的二值化卷积神经网络得到了大量的研究,论文《Binarized Neural Networks:Training Neural Networks with Weights and Activations Constrained to+1or-1》提出将卷积核的权值由双精度浮点数转化为+1或-1值,将原始的卷积运算转化为加减运算,减少参数的存储量及计算量。然而,二值化网络会丢失大量的权值信息,其提取特征的能力较差,因而带来较大的性能损失,无法胜任较为复杂的图像分类任务。论文《Local binary convolutional neural networks》提出了一种局部二值化卷积神经网络,通过随机生成二值化稀疏卷积核,结合可训练的1x1卷积,实现卷积操作中的卷积、非线性与加权运算,减少性能损失。然而,该网络中存在密集的1x1卷积计算,占据了绝大多数的计算资源,且网络层数增加容易导致训练过程中产生梯度消失问题,造成网络难以收敛。综上,现有技术中的二值化卷积神经网络存在性能衰减、效率受限、训练难度较高等缺陷,因此,现有技术中的局部二值化卷积神经网络存在运行效率较低的技术问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种局部二值化CNN的处理方法、装置、存储介质及处理器,以至少解决现有技术中的局部二值化卷积神经网络存在的运行效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种局部二值化CNN的处理方法,该方法包括:根据预设数据集训练第一卷积神经网络,得到第二卷积神经网络;将上述第一卷积神经网络中的全部卷积层单元替换为局部二值化卷积单元,从而得到第三卷积神经网络;将上述第三卷积神经网络中的目标全连接层替换为分组连接层,从而得到第四卷积神经网络,其中,上述目标全连接层为上述第三卷积神经网络中除底层分类层之外的其余全连接层;对上述第四卷积神经网络进行初始化处理,得到第五卷积神经网络;基于上述第二卷积神经网络和上述预设数据集对上述第五卷积神经网络进行训练,得到目标卷积神经网络,其中,上述目标卷积神经网络为达到收敛状态的上述第五卷积神经网络。
进一步地,上述局部二值化卷积单元包括二值化卷积层、1x1分组卷积层,上述将上述第一卷积神经网络中的全部卷积层单元替换为局部二值化卷积单元,从而得到第三卷积神经网络包括:设置上述局部二值化卷积单元中的上述1x1分组卷积层的第一分组数;将上述二值化卷积层的输出特征图依据上述第一分组数进行二维拓扑展开,得到第一目标分组;将上述1x1分组卷积层的卷积核与上述第一目标分组的输出特征图进行连接,得到上述第三卷积神经网络。
进一步地,上述将上述第三卷积神经网络中的目标全连接层替换为分组连接层,从而得到第四卷积神经网络包括:设置上述第三卷积神经网络中的上述分组连接层的第二分组数;将上述分组连接层的输入神经元根据上述第二分组数进行二维拓扑展开,得到第二目标分组;将上述分组连接层的输出神经元与上述第二目标分组的输入神经元进行连接,得到上述第四卷积神经网络。
进一步地,上述基于上述第二卷积神经网络和上述预设数据集对上述第五卷积神经网络进行训练,得到目标卷积神经网络包括:将上述预设数据集中的训练标签所对应的图片输入至上述第二卷积神经网络中,从而得到上述第二卷积神经网络的输出值;对上述输出值进行软化处理,得到软化后的上述输出值;对上述软化后的上述输出值和上述训练标签进行加权求和计算,得到目标训练标签;根据预设随机梯度下降法和上述目标训练标签对上述第五卷积神经网络进行训练,得到上述目标卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海习悦信息技术有限公司,未经珠海习悦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710720466.2/2.html,转载请声明来源钻瓜专利网。