[发明专利]图像处理方法和装置在审
申请号: | 201910464208.1 | 申请日: | 2019-05-30 |
公开(公告)号: | CN112016577A | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 张颐康;钟钊;袁鹏 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 王洪 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 | ||
本申请提供一种图像处理方法和装置。本申请图像处理方法,包括:获取待处理图像;根据所述待处理图像确定特征融合权值;根据所述特征融合权值,利用神经网络中的多个卷积核对所述待处理图像进行卷积处理获取所述待处理图像的一个特征图。本申请减少了神经网络中的冗余操作,并在更少的计算量下达到更高的精度。
技术领域
本申请涉及神经网络技术,尤其涉及一种图像处理方法和装置。
背景技术
卷积神经网络(Convolutional Neural Networks,CNN)是一种包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一,自2012年开始,CNN在分类、检测、分割等任务中逐渐占据了主导地位。
CNN中最基础的处理功能包括:卷积层,作为CNN的核心,其参数由一组可训练学习的卷积核(kernels)组成,每个卷积核对输入进行卷积,提取图像特征。池化层,又称下采样,其作用是减小数据处理量,同时保留有用信息,通常池化层是每四个邻域像素中选择最大值作为四个邻域像素的代表,即选出最能表征特征的像素,缩减了数据量,同时保留了特征。全连接层,其输入输出均为一维向量,本质上全连接操作就是矩阵的乘法操作,输入为一个向量,矩阵为神经网络中存储的参数,输出为输入与矩阵的乘积。非线性激活层,包括修正线性单元、Sigmoid、双曲正切函数等,均为元素级操作。
在上述处理功能中,卷积层占据了CNN绝大多数的计算量,卷积操作可以看成卷积核在输入图像上按步长滑动,每滑动一次求一次卷积的过程,因此为了提高CNN的运行速度,有多种卷积层的变体,其中比较常用的包括深度可分离卷积、分组卷积等。使用卷积层的变体能节省大量计算量,但是仍然有非常多的计算冗余。
发明内容
本申请提供一种图像处理方法和装置,以减少冗余操作,并在更少的计算量下达到更高的精度。
第一方面,本申请提供一种图像处理方法,包括:
获取待处理图像;根据所述待处理图像确定特征融合权值;根据所述特征融合权值,利用神经网络中的多个卷积核对所述待处理图像进行卷积处理获取所述待处理图像的一个特征图。
本申请通过计算待处理图像确定特征融合权值,再基于该特征融合权值利用神经网络中的多个卷积核对待处理图像进行卷积处理得到待处理图像的一个特征图,减少了很多冗余操作,可以在更少的计算量下达到更高的精度。
在一种可能的实现方式中,所述根据所述特征融合权值,利用神经网络中的多个卷积核对所述待处理图像进行卷积处理获取所述待处理图像的一个特征图,包括:根据所述特征融合权值对所述多个卷积核进行融合获取一个融合卷积核;利用所述融合卷积核对所述待处理图像进行卷积处理获取所述待处理图像的一个特征图。
本申请不需要像常规的卷积层那样需要用神经网络中的每个卷积核对待处理图像卷积一次,而是将多个卷积核经加权平均后得到一个融合卷积核,用该融合卷积核对待处理图像卷积一次即可,减少了很多冗余操作,可以在更少的计算量下达到更高的精度。
在一种可能的实现方式中,所述根据所述特征融合权值对所述多个卷积核进行融合获取一个融合卷积核,包括:根据所述特征融合权值计算所述多个卷积核的加权平均值获取所述融合卷积核。
在一种可能的实现方式中,所述根据所述特征融合权值,利用神经网络中的多个卷积核对所述待处理图像进行卷积处理获取所述待处理图像的一个特征图,包括:利用所述多个卷积核中的每一个卷积核分别对所述待处理图像进行卷积处理获取多个中间特征图;根据所述特征融合权值对所述多个中间特征图进行融合获取所述待处理图像的一个特征图。
本申请不需要像常规的卷积层那样针对神经网络中的每个卷积核输出一个特征图,而是将多个中间特征图经加权平均后得到待处理图像的一个特征图,从而减少了接下来的处理模块的计算量,并可以在更少的计算量下达到更高的精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910464208.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序