[发明专利]一种基于深度学习的图像自适应稀疏化表征方法及装置有效

专利信息
申请号: 202010385699.3 申请日: 2020-05-09
公开(公告)号: CN111652246B 公开(公告)日: 2023-04-18
发明(设计)人: 袁春;施诚 申请(专利权)人: 清华大学深圳国际研究生院
主分类号: G06V10/44 分类号: G06V10/44;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/084
代理公司: 深圳新创友知识产权代理有限公司 44223 代理人: 王震宇
地址: 518055 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 图像 自适应 稀疏 表征 方法 装置
【权利要求书】:

1.一种基于深度学习的图像自适应稀疏化表征方法,其特征在于,包括如下步骤:

A1:选取任意的深度卷积神经网络模型M,在卷积操作的每个阶段加入基于半硬注意力机制的深度学习方法,将所述半硬注意力机制加到卷积层中,构建新的深度卷积神经网络模型M';

A2:设置线性递增的半硬注意力稀疏化值域,用于得到稀疏化图像表征;

A3:设置合适于任务的损失函数,利用反向传播训练整个深度卷积神经网络模型M';

其中,所述半硬注意力机制是指,神经网络利用图像特征的统计信息来学习图像特征的权重值,当权重值小于设定的值域k时,将小于k的权重值对应的图像特征归零;

所述步骤A2中,设置一个动态值域函数:

y=min(f(x),k)     (4)

其中,f(x)为线性函数,x代表训练中的迭代次数,从0开始一直递增到最大迭代次数,直到f(x)的值大于k时,动态值域y的值固定为k,不再变化;使网络经过迭代,先让每个图像特征的权重值学到一个局部优解,然后逐步增大权重值归零的值域,最终使得网络收敛到一个总体更优的解上;

每一次迭代时,将注意力值v'i+1,j小于公式(4)中动态值域的那些值设为0,然后作用于当前层的卷积特征上,得到自稀疏化的特征:

F′i+1,*=v′i+1,**Fi+1,*     (5);

其中Fi+1,*表示第i+1个特征图,v'i+1,*为第i+1个特征图对应的半硬注意力值,F'i+1,*为前两者相乘后稀疏化的特征图。

2.如权利要求1所述的方法,其特征在于,所述步骤A1中,使用多次卷积操作,逐步提取图像局部信息,再对拥有局部信息的图像特征进行卷积,从而提取到全局信息。

3.如权利要求1所述的方法,其特征在于,所述步骤A1中,所述卷积操作如式(1):

Fi+1,j=Conv(Fi,*)     (1)

其中,Conv代表卷积操作,Fi+1,j代表第i+1层卷积输出的第j个特征,Fi,*代表第i层的全部特征;

引入注意力机制如式(2),使用每个图像特征的均值vi+1,j来决定该特征的重要性:

vi+1,j=avgpool(Fi+1,j)     (2)

其中,Fi+1,j是一个长为h,宽为w的二维特征,avgpool表示对于Fi+1,j这个二维特征求均值,即,

随后,通过一个线性变换及一个非线性激活函数,将所述均值映射至[0,1]之间的权重:

v'i+1,*=δ(Wvi+1,*)     (3)

其中,v'i+1,*为注意力值,Wvi+1,*为线性变换的可学习权重,δ代表sigmoid激活函数。

4.如权利要求1至3任一项所述的方法,其特征在于,每隔两个卷积层加一个半硬注意力机制用于特征稀疏化。

5.如权利要求1至3任一项所述的方法,其特征在于,所述步骤A3中,使用交叉熵函数来处理图像分类相关任务,使用均方差损失函数来处理目标检测相关任务。

6.如权利要求1至3任一项所述的方法,其特征在于,所述步骤A3中,对于图像分类ImageNet任务,在一维全局特征后接上两个全连接层及一个softmax层输出各类的预测值,使用交叉熵损失函数(Cross Entropy Loss)反向传播训练整个网络:

其中,n代表分类数目,p代表标注给出的正确答案,q代表所训练的模型输出的预测值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010385699.3/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top