[发明专利]用于神经网络的特征图处理方法、装置和系统及存储介质在审
申请号: | 201810932282.7 | 申请日: | 2018-08-16 |
公开(公告)号: | CN109299722A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 张祥雨;马宁宁 | 申请(专利权)人: | 北京旷视科技有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 组特征 输出特征 特征图处理 存储介质 输入特征 通道连接 通道重排 特征图 裁剪 网络 计算量 准确率 | ||
本发明实施例提供一种用于神经网络的特征图处理方法、装置和系统以及存储介质。方法包括:对于至少一个网络块中的每个网络块,经由通道裁剪层接收该网络块的输入特征图,并将输入特征图的通道裁剪为两部分,以获得第一组特征图和第二组特征图;将第一组特征图输入第一通路,并将第二组特征图输入第二通路;经由通道连接层将第一通路的输出特征图和第二通路的输出特征图进行通道连接,以获得连接后的特征图;经由通道重排层对连接后的特征图进行通道重排,以获得该网络块的输出特征图。这种工作方式可以减少神经网络的计算量,并提高神经网络的速度和准确率。
技术领域
本发明涉及机器学习领域,更具体地涉及一种用于神经网络的特征图处理方法、装置和系统以及存储介质。
背景技术
在图像识别领域,深度神经网络的网络层已经可以达到上百层,通道数可以达到上千个。深度神经网络的识别准确率可随着网络的深度和通道数的增加而增加,但同时也需要大量的计算量和参数量。一般来说,深度神经网络的计算量可以达到上亿FLOPs(每秒浮点运算次数)。然而,诸如手机、机器人等移动设备只有几十或几百MFLOPs(每秒百万个浮点运算次数)的计算量预算,这使得深度神经网络在这些设备上难以运行。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种用于神经网络的特征图处理方法、装置和系统以及存储介质。
根据本发明一方面,提供了一种用于神经网络的特征图处理方法,所述神经网络包括至少一个网络块,所述至少一个网络块中的每个网络块包括通道裁剪层、第一通路、第二通路、通道连接层和通道重排层,所述第二通路包括至少一个卷积层,方法包括:对于所述至少一个网络块中的每个网络块,经由所述通道裁剪层接收该网络块的输入特征图,并将所述输入特征图的通道裁剪为两部分,以获得第一组特征图和第二组特征图;对于所述至少一个网络块中的每个网络块,将所述第一组特征图输入所述第一通路,并将所述第二组特征图输入所述第二通路;对于所述至少一个网络块中的每个网络块,经由所述通道连接层将所述第一通路的输出特征图和所述第二通路的输出特征图进行通道连接,以获得连接后的特征图;对于所述至少一个网络块中的每个网络块,经由所述通道重排层对所述连接后的特征图进行通道重排,以获得该网络块的输出特征图。
示例性地,所述至少一个网络块包括至少一个第一网络块,所述至少一个第一网络块中的每个第一网络块的所述第二通路包括第一卷积层、第二卷积层和第三卷积层,所述方法还包括:对于所述至少一个第一网络块中的每个第一网络块,经由所述第一卷积层对所述第二组特征图进行降维卷积;对于所述至少一个第一网络块中的每个第一网络块,经由所述第二卷积层和所述第三卷积层对所述第一卷积层的输出特征图进行深度分离卷积,以获得所述第二通路的输出特征图。
示例性地,所述第二卷积层用于对所述第一卷积层的输出特征图执行步长为1的卷积,所述第一通路是所述通道裁剪层和所述通道连接层之间的跳跃连接通路。
示例性地,所述第二卷积层用于对所述第一卷积层的输出特征图执行步长为2的卷积,所述第一通路包括池化层,所述方法还包括:经由所述池化层对所述第一组特征图执行步长为2的池化,以获得所述第一通路的输出特征图。
示例性地,所述至少一个网络块包括至少一个第二网络块,所述至少一个第二网络块中的每个第二网络块的所述第二通路包括残差结构,所述残差结构包括残差支路和跳跃连接支路,所述残差支路包括所述至少一个卷积层,所述方法还包括:对于所述至少一个第二网络块中的每个第二网络块,经由所述残差支路对所述第二组特征图进行卷积;对于所述至少一个第二网络块中的每个第二网络块,将所述残差支路的输出特征图和所述跳跃连接支路输出的所述第二组特征图进行元素相加,以获得所述第二通路的输出特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810932282.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图像识别技术的菜品识别系统和方法
- 下一篇:一种铁路货车运行监测系统