[发明专利]一种基于深度学习的图像自适应稀疏化表征方法及装置有效
申请号: | 202010385699.3 | 申请日: | 2020-05-09 |
公开(公告)号: | CN111652246B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 袁春;施诚 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/084 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 王震宇 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 图像 自适应 稀疏 表征 方法 装置 | ||
1.一种基于深度学习的图像自适应稀疏化表征方法,其特征在于,包括如下步骤:
A1:选取任意的深度卷积神经网络模型M,在卷积操作的每个阶段加入基于半硬注意力机制的深度学习方法,将所述半硬注意力机制加到卷积层中,构建新的深度卷积神经网络模型M';
A2:设置线性递增的半硬注意力稀疏化值域,用于得到稀疏化图像表征;
A3:设置合适于任务的损失函数,利用反向传播训练整个深度卷积神经网络模型M';
其中,所述半硬注意力机制是指,神经网络利用图像特征的统计信息来学习图像特征的权重值,当权重值小于设定的值域k时,将小于k的权重值对应的图像特征归零;
所述步骤A2中,设置一个动态值域函数:
y=min(f(x),k) (4)
其中,f(x)为线性函数,x代表训练中的迭代次数,从0开始一直递增到最大迭代次数,直到f(x)的值大于k时,动态值域y的值固定为k,不再变化;使网络经过迭代,先让每个图像特征的权重值学到一个局部优解,然后逐步增大权重值归零的值域,最终使得网络收敛到一个总体更优的解上;
每一次迭代时,将注意力值v'i+1,j小于公式(4)中动态值域的那些值设为0,然后作用于当前层的卷积特征上,得到自稀疏化的特征:
F′i+1,*=v′i+1,**Fi+1,* (5);
其中Fi+1,*表示第i+1个特征图,v'i+1,*为第i+1个特征图对应的半硬注意力值,F'i+1,*为前两者相乘后稀疏化的特征图。
2.如权利要求1所述的方法,其特征在于,所述步骤A1中,使用多次卷积操作,逐步提取图像局部信息,再对拥有局部信息的图像特征进行卷积,从而提取到全局信息。
3.如权利要求1所述的方法,其特征在于,所述步骤A1中,所述卷积操作如式(1):
Fi+1,j=Conv(Fi,*) (1)
其中,Conv代表卷积操作,Fi+1,j代表第i+1层卷积输出的第j个特征,Fi,*代表第i层的全部特征;
引入注意力机制如式(2),使用每个图像特征的均值vi+1,j来决定该特征的重要性:
vi+1,j=avgpool(Fi+1,j) (2)
其中,Fi+1,j是一个长为h,宽为w的二维特征,avgpool表示对于Fi+1,j这个二维特征求均值,即,
随后,通过一个线性变换及一个非线性激活函数,将所述均值映射至[0,1]之间的权重:
v'i+1,*=δ(Wvi+1,*) (3)
其中,v'i+1,*为注意力值,Wvi+1,*为线性变换的可学习权重,δ代表sigmoid激活函数。
4.如权利要求1至3任一项所述的方法,其特征在于,每隔两个卷积层加一个半硬注意力机制用于特征稀疏化。
5.如权利要求1至3任一项所述的方法,其特征在于,所述步骤A3中,使用交叉熵函数来处理图像分类相关任务,使用均方差损失函数来处理目标检测相关任务。
6.如权利要求1至3任一项所述的方法,其特征在于,所述步骤A3中,对于图像分类ImageNet任务,在一维全局特征后接上两个全连接层及一个softmax层输出各类的预测值,使用交叉熵损失函数(Cross Entropy Loss)反向传播训练整个网络:
其中,n代表分类数目,p代表标注给出的正确答案,q代表所训练的模型输出的预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010385699.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防堵塞的去石机
- 下一篇:驻车空调及其控制方法、装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序