[发明专利]一种人工智能处理器的学习任务编译方法及相关产品有效
申请号: | 201911296837.4 | 申请日: | 2019-12-16 |
公开(公告)号: | CN110766146B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 黄易 |
地址: | 100190 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人工智能 处理器 学习 任务 编译 方法 相关 产品 | ||
1.一种人工智能处理器的学习任务编译方法,其特征在于,所述方法包括:
通用处理器获取第一配置参数及第二配置参数,其中,所述第一配置参数包括所述人工智能处理器的学习任务对应卷积神经网络的Batch Norm层的第一训练参数和第二训练参数;所述第二配置参数包括Scale层的第一训练参数和第二训练参数;
所述通用处理器将所述Batch Norm层的第一训练参数以及所述Scale层的第一训练参数与所述卷积神经网络的卷积层的权值参数融合,得到第一融合结果;若所述Batch Norm层的第一训练参数包括多个第一训练子参数,则所述通用处理器将所述多个第一训练子参数进行运算,得到第一中间运算结果将所述第一中间运算结果以及所述Scale层的第一训练参数与所述卷积层的权值参数相乘,得到所述第一融合结果其中,所述第一融合结果中的weights为所述Scale层的第一训练参数与所述卷积层的权值参数进行融合更新后的权值参数,更新过程为:
所述Scale层的第一训练参数包括的一个第一训练子参数与所述卷积层的权值参数相乘,得到融合结果,作为所述融合更新后的权值参数;
所述通用处理器将所述Batch Norm层的第二训练参数以及所述Scale层的第二训练参数与所述卷积神经网络的卷积层的偏置参数融合,得到第二融合结果;若所述Batch Norm层的第二训练参数包括多个第二训练子参数,则所述通用处理器将所述多个第二训练子参数进行运算,得到第二中间运算结果将所述第二中间运算结果以及所述Scale层的第二训练参数与所述卷积层的偏置参数相加,得到所述第二融合结果其中,所述第二融合结果中bias为所述Scale层的第二训练参数与所述卷积层的偏置参数进行融合更新后的偏置参数,更新过程为:
所述Scale层的第二训练参数包括的一个第二训练子参数与所述卷积层的偏置参数相加,得到融合结果,作为所述融合更新后的偏置参数;
所述通用处理器根据所述第一融合结果以及所述第二融合结果,对所述卷积神经网络进行优化,得到优化后的卷积神经网络;
对优化后的卷积神经网络进行编译,得到对应的二进制指令序列,利用任务调度装置以分配至人工智能处理器上执行对应的学习任务;其中,所述任务调度装置包括:第一读写电路,用于在接收到任务的任务调度请求时,根据所述任务的任务调度请求,获取任务的分解信息和全部任务信息,以及处理器的状态信息;匹配电路,用于根据各个任务的所述分解信息和所述全部任务信息,以及人工智能处理器的处理器核的状态信息,分别将任务的各个作业与所述处理器核进行匹配,并将与所述处理器核匹配成功的作业添加至待调度作业集;选择电路,用于根据所述待调度作业集中各个作业的目标权重从所述待调度作业集中选定目标作业,获取调度信息。
2.根据权利要求1所述的方法,其特征在于,所述通用处理器将所述Batch Norm层的第一训练参数以及所述Scale层的第一训练参数与所述卷积神经网络的卷积层的权值参数融合,得到第一融合结果,包括:
所述通用处理器将所述Batch Norm层的第一训练参数、所述Scale层的第一训练参数以及所述卷积层的权值参数进行乘法运算,得到所述第一融合结果。
3.根据权利要求1所述的方法,其特征在于,所述通用处理器将所述Batch Norm层的第二训练参数以及所述Scale层的第二训练参数与所述卷积神经网络的卷积层的偏置参数融合,得到第二融合结果,包括:
所述通用处理器将所述Batch Norm层的第二训练参数、所述Scale层的第二训练参数以及所述卷积层的偏置参数进行加法运算,得到所述第二融合结果。
4.根据权利要求1所述的方法,其特征在于,所述通用处理器根据所述第一融合结果以及所述第二融合结果,对所述卷积神经网络进行优化,得到优化后的卷积神经网络,包括:
所述通用处理器删除所述Batch Norm层以及所述Scale层,并将所述卷积层的权值参数更改为所述第一融合结果,将所述卷积层的偏置参数更改为所述第二融合结果。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述通用处理器将卷积层的输入数据分别与所述第一融合结果和所述第二融合结果进行卷积计算,得到卷积层的输出结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911296837.4/1.html,转载请声明来源钻瓜专利网。