[发明专利]一种基于信息熵动态赋权的多任务学习自适应平衡方法在审

专利信息
申请号: 202110820646.4 申请日: 2021-07-20
公开(公告)号: CN113537365A 公开(公告)日: 2021-10-22
发明(设计)人: 王玉峰;丁文锐;肖京 申请(专利权)人: 北京航空航天大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/08
代理公司: 北京永创新实专利事务所 11121 代理人: 易卜
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 信息 动态 任务 学习 自适应 平衡 方法
【权利要求书】:

1.一种基于信息熵动态赋权的多任务学习自适应平衡方法,其特征在于,具体为:

首先,搭建初始多任务学习模型M,并通过多任务学习模型M对输入图像进行推断,得到不同任务的不同类型输出,分别进行归一化处理,得到不同任务对应的归一化概率图;

然后,利用各归一化概率图计算多任务损失函数,通过多任务损失函数对多任务学习模型M进行初步训练;

最后,在初步训练后的多任务学习模型M基础上,通过信息熵动态赋权算法构建最终的自适应多任务损失函数,并利用反向传播算法获得当前多任务学习模型M的参数梯度,进行参数更新,完成一次迭代训练;

迭代训练后,得到新的多任务学习模型M1,重新对输入图像进行推断和归一化,利用自适应多任务损失函数进行下一次迭代,直至多任务学习模型M1达到收敛,终止训练。

2.根据权利要求1所述的一种基于信息熵动态赋权的多任务学习自适应平衡方法,其特征在于,所述的多任务学习模型包含一个共享编码器和对应于各特定任务的解码器。

3.根据权利要求1所述的一种基于信息熵动态赋权的多任务学习自适应平衡方法,其特征在于,所述的三种任务输出图为:语义分割输出图Ps、深度估计输出图Pd和边缘检测输出图Pb;对应的归一化概率图为:

1)语义分割输出图Ps,采用sonmax函数进行处理,得到归一化后的语义分割概率图:

其中,S为语义分割总类别数,i表示预测图中第i层语义类别,Ps,i为模型输出图Ps的第i层语义分割数值图,而P’s,i则表示归一化后的第i层语义分割概率图P’s

2)分类边缘检测输出图Pb,采用sigmoid函数进行处理,得到归一化后的边缘检测概率图P’b

3)深度估计输出图Pd,利用对数空间离散化策略将深度回归任务转化为分类任务,采用sonmax函数得到归一化后的深度分类概率图;

首先,采用对数空间离散化策略将连续空间的深度值离散划分为K个子间隔对应K个类别,具体为:

将深度值区间[D1,D2]映射到[D1+1,D2+1],记为[D′1,D′2],并按照离散化深度阈值dk进行划分,得到K个子间隔{[d0,d1],[d1,d2],...,[dK-1,dK]};

离散化深度阈值dk定义为:

然后,将深度估计真值按照上述策略离散化为深度分类真值,即当深度估计真值处于[dk-1,dk]时对其分配类别为k,并以深度分类真值训练深度任务分支;

最后,在训练阶段得到深度分类预测图,并采用softmax函数进行处理,获得归一化后的深度分类概率图P’d,k

深度分类概率图为:

其中,K为深度分类总类别数,k表示第k个深度类别,Pd,k表示第k层深度分类预测图,P′d,k表示归一化后的第k层深度分类概率图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110820646.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top