[发明专利]一种数据处理方法及处理装置有效
申请号: | 201810464380.2 | 申请日: | 2018-05-15 |
公开(公告)号: | CN110490295B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 杨帆;郑成林 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/02 | 分类号: | G06N3/02 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 处理 装置 | ||
本申请实施例公开一种神经网络模型、数据处理方法及处理装置,涉及计算机技术领域,解决神经网络模型处理不同任务性能低的问题。神经网络模型用于执行N个任务,包括M个网络层,M为正整数,第i个网络层具有用于执行N个任务中的每个任务的共享权重值和N组特有权重值,每组特有权重值用于执行N个任务中的一个任务,每组特有权重值与N个任务中的一个任务一一对应,1≤i≤M;第i个网络层在执行第一任务时被配置为:获取输入数据;根据第t组特有权重值、共享权重值以及输入数据,获取输出数据;当1≤i<M时,向第i+1个网络层传输输出数据,第t组特有权重值与第一任务对应,1≤t≤N;当i=M时,输出输出数据。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种神经网络模型、数据处理方法及处理装置。
背景技术
神经网络模型是一种由大量的节点(或称为神经元)相互联接组成的运算模型。常用的神经网络模型包括输入层、输出层以及多个隐藏层(也称为隐层)。对于任一隐藏层而言,该隐藏层的输出作为该隐藏层的下一层(另一隐藏层或输出层)的输入。神经网络模型中除输出层以外的每一层均可根据相应参数集(如权重值)对其输入数据进行计算,以生成输出数据。
卷积神经网络(Convolutional Neural Network,CNN)模型为其中一种神经网络模型。 CNN模型在图像识别、语音处理、智能机器人等应用领域取得了令人瞩目的成果。对多个任务进行处理的卷积神经网络模型的泛化能力较强,能够适当降低每个任务占用的资源以及存储成本。
发明内容
本申请实施例提供一种神经网络模型、数据处理方法及处理装置,能够解决神经网络模型在处理不同任务时性能低的问题。
为达到上述目的,本申请采用如下技术方案:
第一方面,提供一种神经网络模型,该神经网络模型用于执行N(N为大于或等于2的整数)个任务,该N个任务包括第一任务,所述神经网络模型包括M(M为正整数)个网络层,M个网络层中的第i(1≤i≤M,i为整数)个网络层具有共享权重值和N组特有权重值,这里的共享权重值用于执行所述N个任务中的每个任务,N组特有权重值中的每组特有权重值用于执行所述N个任务中的一个任务,且每组特有权重值与所述N个任务中的一个任务一一对应。第i个网络层在执行第一任务时被配置为:获取输入数据;根据第t(1≤t≤N,t为整数)组特有权重值、上述共享权重值以及获取到的输入数据,获取输出数据;当1≤i<M 时,向M个网络层中的第i+1个网络层传输上述输出数据,其中,第t组特有权重值与第一任务对应;当i=M时,输出上述输出数据。
第i个网络层的N组特有权重值中的每组特有权重值用于执行N个任务中的一个任务,且每组特有权重值与N个任务中的一个任务一一对应,因此,对于任意一个任务而言,第i 个网络层在进行数据处理时,只需要获取共享权重值以及与当前任务对应的特定权重值即可,而无需获取与其他任务对应的特定权重值,有效的提高了第i个网络层的性能,进而提高了神经网络模型的性能。
此外,由于共享权重值用于执行N个任务中的每个任务,因此,在切换任务的场景中,第i个网络层无需重新获取共享权重值,只需获取与当前任务对应的特有权重值即可,减少了数据的读取次数,提高了处理性能。
可选的,在本申请的一种可能的实现方式中,上述第i个网络层为卷积层、全连接层、反卷积层和循环层中的任意一种。
在实际应用中,第i个网络层可以为卷积层,也可以为全连接层,还可以为反卷积层,还可以为循环层,本申请对此不作具体限定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810464380.2/2.html,转载请声明来源钻瓜专利网。