[发明专利]一种缓解多任务学习中任务冲突方法、装置及存储介质在审
申请号: | 202110599827.9 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113420787A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 廖清;柴合言;王晔;漆舒汉;王轩 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/11 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭浩辉;颜希文 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 缓解 任务 学习 冲突 方法 装置 存储 介质 | ||
1.一种缓解多任务学习中任务冲突的方法,其特征在于,包括:
获取待缓解多任务学习模型中各个学习任务的梯度值;
任意选取一学习任务作为选定学习任务,根据所述选定学习任务执行梯度值更新;其中,所述梯度值更新具体包括:根据所述选定学习任务的梯度值以及其余各学习任务的梯度值,逐一判断所述选定学习任务与其余各学习任务之间是否存在任务冲突;在每一次判定存在任务冲突时,对所述选定学习任务的梯度值进行梯度修剪,并将所述选定学习任务的梯度值更新为修剪后的梯度值,根据所述选定学习任务更新后的梯度值继续判断所述选定学习任务与其余各学习任务之间是否存在任务冲突;
在所述梯度值更新执行完毕后,重新选取一学习任务作为更新后的选定学习任务,并重复执行所述梯度值更新,直至所有所述学习任务的梯度值更新完毕;
计算所有所述学习任务完成梯度值更新后的梯度值的平均值,获得平均梯度,根据所述平均梯度对所述待缓解多任务学习模型的网络参数进行更新。
2.如权利要求1所述的缓解多任务学习中任务冲突的方法,其特征在于,所述获取待缓解多任务学习模型中各个学习任务的梯度值,具体包括:
计算每一所述学习任务的损失值,继而根据每一所述学习任务的损失值计算每一所述学习任务对所述待缓解多任务学习模型中网络参数的偏导数,获得每一所述学习任务的梯度值。
3.如权利要求2所述的缓解多任务学习中任务冲突的方法,其特征在于,所述对所述选定学习任务的梯度值进行梯度修剪,具体包括:
根据所述选定学习任务的梯度值以及冲突学习任务的梯度值,确定所述选定学习任务与所述冲突学习任务的冲突平面;其中,所述冲突学习任务为与所述选定学习任务存在任务冲突的学习任务;
分别计算所述选定学习任务以及所述冲突学习任务在所述冲突平面上的梯度分量,继而根据所述梯度分量计算选定学习任务与所述冲突学习任务之间的梯度分量差值;
根据所述梯度分量差值对所述选定学习任务的梯度值进行梯度值修剪,获得修剪后的梯度值。
4.如权利要求3所述的缓解多任务学习中任务冲突的方法,其特征在于,所述根据所述选定学习任务的梯度值以及冲突学习任务的梯度值,确定所述选定学习任务与所述冲突学习任务的冲突平面,具体包括:
通过以下公式确定所述选定学习任务与所述冲突学习任务的冲突平面:
Pγ=gi-gj;
其中,gi为所述选定学习任务的梯度值,gj为所述冲突学习任务的梯度值。
5.如权利要求4所述的缓解多任务学习中任务冲突的方法,其特征在于,所述分别计算所述选定学习任务以及所述冲突学习任务在所述冲突平面上的梯度分量,继而根据所述梯度分量计算选定学习任务与所述冲突学习任务之间的梯度分量差值,具体包括:
通过以下公式计算所述选定学习任务以及所述冲突学习任务与所述冲突平面的夹角的余弦值;
通过以下公式计算所述选定学习任务以及所述冲突学习任务在所述冲突平面上的梯度分量:
Δgi=gi·cosφi,Δgj=gj·cosφj;
通过以下公式计算所述梯度分量计算选定学习任务与所述冲突学习任务之间的梯度分量差值:
Δg{i,j}=||gi·cosφi-gj·cosφj||;
其中,cosφi为所述选定学习任务与所述冲突平面的夹角的余弦值,cosφj为所述冲突学习任务与所述冲突平面的夹角的余弦值,Δgi为所述选定学习任务在所述冲突平面上的梯度分量,Δgj为所述冲突学习任务在所述冲突平面上的梯度分量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110599827.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于升降机构的控制装置
- 下一篇:一种高能量密度方形铝壳锂离子电池