[发明专利]一种缓解多任务学习中任务冲突方法、装置及存储介质在审

申请号：	202110599827.9	申请日：	2021-05-31
公开（公告）号：	CN113420787A	公开（公告）日：	2021-09-21
发明（设计）人：	廖清;柴合言;王晔;漆舒汉;王轩	申请（专利权）人：	哈尔滨工业大学（深圳）
主分类号：	G06K9/62	分类号：	G06K9/62;G06F17/11
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	郭浩辉;颜希文
地址：	518055 广东省深圳市南***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种缓解任务学习冲突方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种缓解多任务学习中任务冲突的方法，其特征在于，包括：

获取待缓解多任务学习模型中各个学习任务的梯度值；

任意选取一学习任务作为选定学习任务，根据所述选定学习任务执行梯度值更新；其中，所述梯度值更新具体包括：根据所述选定学习任务的梯度值以及其余各学习任务的梯度值，逐一判断所述选定学习任务与其余各学习任务之间是否存在任务冲突；在每一次判定存在任务冲突时，对所述选定学习任务的梯度值进行梯度修剪，并将所述选定学习任务的梯度值更新为修剪后的梯度值，根据所述选定学习任务更新后的梯度值继续判断所述选定学习任务与其余各学习任务之间是否存在任务冲突；

在所述梯度值更新执行完毕后，重新选取一学习任务作为更新后的选定学习任务，并重复执行所述梯度值更新，直至所有所述学习任务的梯度值更新完毕；

计算所有所述学习任务完成梯度值更新后的梯度值的平均值，获得平均梯度，根据所述平均梯度对所述待缓解多任务学习模型的网络参数进行更新。

2.如权利要求1所述的缓解多任务学习中任务冲突的方法，其特征在于，所述获取待缓解多任务学习模型中各个学习任务的梯度值，具体包括：

计算每一所述学习任务的损失值，继而根据每一所述学习任务的损失值计算每一所述学习任务对所述待缓解多任务学习模型中网络参数的偏导数，获得每一所述学习任务的梯度值。

3.如权利要求2所述的缓解多任务学习中任务冲突的方法，其特征在于，所述对所述选定学习任务的梯度值进行梯度修剪，具体包括：

根据所述选定学习任务的梯度值以及冲突学习任务的梯度值，确定所述选定学习任务与所述冲突学习任务的冲突平面；其中，所述冲突学习任务为与所述选定学习任务存在任务冲突的学习任务；

分别计算所述选定学习任务以及所述冲突学习任务在所述冲突平面上的梯度分量，继而根据所述梯度分量计算选定学习任务与所述冲突学习任务之间的梯度分量差值；

根据所述梯度分量差值对所述选定学习任务的梯度值进行梯度值修剪，获得修剪后的梯度值。

4.如权利要求3所述的缓解多任务学习中任务冲突的方法，其特征在于，所述根据所述选定学习任务的梯度值以及冲突学习任务的梯度值，确定所述选定学习任务与所述冲突学习任务的冲突平面，具体包括：

通过以下公式确定所述选定学习任务与所述冲突学习任务的冲突平面：

P_γ＝g_i-g_j；

其中，g_i为所述选定学习任务的梯度值，g_j为所述冲突学习任务的梯度值。

5.如权利要求4所述的缓解多任务学习中任务冲突的方法，其特征在于，所述分别计算所述选定学习任务以及所述冲突学习任务在所述冲突平面上的梯度分量，继而根据所述梯度分量计算选定学习任务与所述冲突学习任务之间的梯度分量差值，具体包括：

通过以下公式计算所述选定学习任务以及所述冲突学习任务与所述冲突平面的夹角的余弦值；

通过以下公式计算所述选定学习任务以及所述冲突学习任务在所述冲突平面上的梯度分量：

Δg_i＝g_i·cosφ_i，Δg_j＝g_j·cosφ_j；

通过以下公式计算所述梯度分量计算选定学习任务与所述冲突学习任务之间的梯度分量差值：

Δg_{i，j}＝||g_i·cosφ_i-g_j·cosφ_j||；

其中，cosφ_i为所述选定学习任务与所述冲突平面的夹角的余弦值，cosφ_j为所述冲突学习任务与所述冲突平面的夹角的余弦值，Δg_i为所述选定学习任务在所述冲突平面上的梯度分量，Δg_j为所述冲突学习任务在所述冲突平面上的梯度分量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学（深圳），未经哈尔滨工业大学（深圳）许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110599827.9/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种缓解多任务学习中任务冲突方法、装置及存储介质在审

专利文献下载