[发明专利]一种图像处理方法、装置及计算机存储介质在审
申请号: | 202010354847.5 | 申请日: | 2020-04-28 |
公开(公告)号: | CN111639652A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 程帅;贾书军;杨春阳 | 申请(专利权)人: | 博泰车联网(南京)有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06N3/04;G06K9/62 |
代理公司: | 上海波拓知识产权代理有限公司 31264 | 代理人: | 张媛 |
地址: | 210032 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 处理 方法 装置 计算机 存储 介质 | ||
本发明公开了一种图像处理方法、装置及计算机存储介质,所述图像处理方法包括:获取图像的初始特征图;对所述初始特征图进行卷积处理,获取所述初始特征图的各通道的特征向量;其中,所述卷积处理使用的卷积参数由所述初始特征图的高和宽确定;对所述各通道的特征向量进行Softmax操作,获取所述各通道的注意力值;根据所述初始特征图和所述各通道的注意力值获取新特征图。本发明提供的图像处理方法、装置及计算机存储介质,通过采用端到端的方式自适应学习输入的特征图的有效表达,使学习到的特征基于所在任务具有判别性和代表性,能够提高处理效率和准确性。
技术领域
本发明涉及图像处理领域,特别是涉及一种图像处理方法、装置及计算机存储介质。
背景技术
人类视觉注意力机制是利用有限的注意力资源从大量信息中快速筛选出高价值信息的手段,此机制提高了视觉信息处理的效率与准确性。深度学习中的注意力机制借鉴了人类的注意力思维方式,核心目标是从众多信息中选择出对当前任务目标更关键的信息,被广泛的应用在图像分类、检测等各种不同类型的任务中,并取得了显著的成果。其中,以SENet(Squeeze-and-Excitation Networks)为代表的通道注意力机制被广泛应用在图像分类、目标检测、语义分割中,此类方法首先对特征图的每个通道进行全局平均池化,之后通过Softmax得到每个通道的注意力值(即关注度),而注意力值大小代表通道的重要性及关注程度,最后将注意力值与原来的特征图相乘。这种结构的原理是想通过控制注意力值的大小,把重要的特征增强,不重要的特征减弱,从而让提取的特征指向性更强。虽然通道注意力机制在不同任务中都取得了较好的效果,但在此类方法中,全局平均池化仅仅利用先验性假设得到每个通道的表示,认为每个像素对整个特征图的作用和贡献是一样,此方式得到的表达特征不具有判别性和代表性,即非最优表达,因此,处理的准确性有待提高。
发明内容
本发明的目的在于提供一种图像处理方法、装置及计算机存储介质,能够提高处理效率和准确性。
为达到上述目的,本发明的技术方案是这样实现的:
第一方面,本发明实施例提供了一种图像处理方法,所述图像处理方法包括:
获取图像的初始特征图;
对所述初始特征图进行卷积处理,获取所述初始特征图的各通道的特征向量;其中,所述卷积处理使用的卷积参数由所述初始特征图的高和宽确定;
对所述各通道的特征向量进行Softmax操作,获取所述各通道的注意力值;
根据所述初始特征图和所述各通道的注意力值获取新特征图。
作为其中一种实施方式,所述对所述初始特征图进行卷积处理,获取所述初始特征图的各通道的特征向量,包括:
对所述初始特征图进行特征增强处理;
对特征增强处理后的所述初始特征图进行卷积处理,获取所述初始特征图的各通道的特征向量。
作为其中一种实施方式,所述对所述初始特征图进行特征增强处理,包括:
采用1*1的卷积核对所述初始特征图进行卷积处理,以增强所述初始特征图的特征。
作为其中一种实施方式,所述对特征增强处理后的所述初始特征图进行卷积处理,获取所述初始特征图的各通道的特征向量,包括:
采用H*W的卷积核对特征增强处理后的所述初始特征图的各通道进行卷积处理,获取所述各通道的特征向量;其中,H表示所述初始特征图的高,W表示所述初始特征图的宽。
作为其中一种实施方式,所述采用H*W的卷积核对特征增强处理后的所述初始特征图的各通道进行卷积处理,获取所述各通道的特征向量之前,还包括:
对特征增强处理后的所述初始特征图进行归一化处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于博泰车联网(南京)有限公司,未经博泰车联网(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010354847.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序