[发明专利]一种基于深度学习的图像自适应稀疏化表征方法及装置有效
申请号: | 202010385699.3 | 申请日: | 2020-05-09 |
公开(公告)号: | CN111652246B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 袁春;施诚 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/084 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 王震宇 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图像 自适应 稀疏 表征 方法 装置 | ||
一种基于深度学习的图像自适应稀疏化表征方法及装置,本方法包括:A1:选取任意的深度卷积神经网络模型M,在卷积操作的每个阶段加入基于半硬注意力机制的深度学习方法,将所述半硬注意力机制加到卷积层中,构建新的深度卷积神经网络模型M';A2:设置线性递增的半硬注意力稀疏化值域,用于得到稀疏化图像表征;A3:设置合适于任务的损失函数,利用反向传播训练整个深度卷积神经网络模型M'。本方法在不引入额外的时间复杂度和空间复杂度的情况下,稳定提升深度卷积模型在图像识别、目标检测等计算机视觉任务上的识别精度。
技术领域
本发明涉及计算机视觉技术和深度学习领域,特别是一种基于深度学习的图像自适应稀疏化表征方法及装置。
背景技术
计算机视觉是由照相机拍摄自然景物或电脑生成为图像的形式,通过电子设备对图像中的目标进行内容识别和定位监测。这个任务可以说是机器学习在视觉领域的一种应用,是人工智能领域的一个重要组成部分。计算机视觉的主要研究内容可以概括为:通过采集图片或视频,并对已采集的图片或视频进行预处理和分析,从中来获得我们所需要的信息,这些信息往往被我们称之为特征。简而言之就是运用照相机以及电子设备来获取图片或视频的内在信息。
计算机视觉是一门涉及领域较广的综合性学科。从目前阶段的研究来看,计算机视觉试图建立一种人工智能系统,即我们常说的AI(Artificial Intelligence)系统,近几年来围绕计算机视觉相关的理论或者技术主要是为了从图像或者视频中提取高维特征,即作为图像或视频信息的一种表达方式。
传统特征提取方法,主要依赖于人工设定的特征提取方式,如经典的SIFT(Scale-Invariant Feature Transform)特征。SIFT特征主要有以下四个基本步骤:(1)尺度空间极值点检测,即对于图像缩放后的多尺度特征的每一个位置进行极值点搜索,通过高斯微分函数来识别潜在的对于尺度和旋转具有不变性的兴趣点;(2)关键点定位,在多尺度的每个位置上,通过拟合一个精细的模型来判断第一步中检测到的候选极值点是否稳定,选取较稳定的那一部分作为后续计算的关键点;(3)确定关键点的方向,根据图像局部的信息来确定梯度方向,分配给每个关键点一个或者多个方向,所有后续的对图像数据的操作,其本质都是对于关键点的方向、尺度和位置进行变换,从而最终能提供鲁棒的,具有旋转不变性及空间不变性的特征。(4)关键点描述,在每个关键点的局部领域内,在不同的尺度上测量图像局部的梯度。一张图像的所有梯度的集合,即是该图像的SIFT特征,它最终会对较大的局部形状的变形和光照变化具有鲁棒性。
现代深度学习特征提取方法,基于图像的深度学习方法相比于SIFT等传统特征提取方法在设计上要简单很多,仅有三部分组成:(1)卷积层,对图像特征的局部信息进行卷积,获取具有局部感受野的图像信息;(2)非线性层,用于增强卷积层输出特征的表征能力;(3)全连接层,对图像特征的全局信息进行变形变换,获取具有全局感受野的图像信息。现代深度学习特征提取方法所学到的特征与传统特征有相似之处,本质上都是对于图像内容位置不变性和旋转不变性的一种表征,但由于它使用反向传播,根据具体数据集训练每个神经网络层,在大数据条件下,展示出更鲁棒的图像信息表征能力。
发明内容
本发明的主要目的在于提供一种基于深度学习的图像自适应稀疏化表征方法及装置,以在不引入额外的时间复杂度和空间复杂度的情况下,提升深度卷积模型在图像识别、目标检测等计算机视觉任务上的识别精度。
为实现上述目的,本发明采用以下技术方案:
一种基于深度学习的图像自适应稀疏化表征方法,包括如下步骤:
A1:选取任意的深度卷积神经网络模型M,在卷积操作的每个阶段加入基于半硬注意力机制的深度学习方法,将所述半硬注意力机制加到卷积层中,构建新的深度卷积神经网络模型M';
A2:设置线性递增的半硬注意力稀疏化值域,用于得到稀疏化图像表征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010385699.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防堵塞的去石机
- 下一篇:驻车空调及其控制方法、装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序