[发明专利]一种AI芯片的运行方式的确定方法和装置有效
申请号: | 202010462971.3 | 申请日: | 2020-05-27 |
公开(公告)号: | CN113743598B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 周智强;叶挺群 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/0464 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 项京;马敬 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 ai 芯片 运行 方式 确定 方法 装置 | ||
1.一种人工智能AI芯片的运行方式的确定方法,其特征在于,所述方法包括:
获得目标神经网络模型;
获得AI芯片支持的运行方式的不同组合,其中,每种组合中包括:所述目标神经网络模型中的各个网络层的运行方式;每个网络层的运行方式包括:所述AI芯片中执行该网络层的算法的计算单元,和/或,所述AI芯片中的计算单元执行该网络层的算法时采用的数据存储格式;使得所述AI芯片基于所述不同组合,用所述目标神经网络模型对第一预设测试数据进行多次处理;
获得所述AI芯片每次对所述第一预设测试数据处理完成所用的第一处理时长;
选择第一处理时长最短的组合中包括的运行方式,确定为基于所述目标神经网络模型对数据进行处理时,所述AI芯片的运行方式;
所述获得AI芯片支持的运行方式的不同组合,包括:
确定所述目标神经网络模型中符合第一预设条件的网络层,作为第一网络层;
获得所述第一网络层支持的运行方式的不同子组合;其中,每种子组合中包括:各个第一网络层的运行方式;
获得所述目标神经网络模型中的各个非第一网络层的预设运行方式;
对所述第一网络层支持的运行方式的不同子组合,和所述各个非第一网络层的预设运行方式进行组合,得到AI芯片支持的运行方式的不同组合;
所述确定所述目标神经网络模型中符合第一预设条件的网络层,作为第一网络层,包括:
按照网络层连接的先后顺序,确定所述目标神经网络模型中前第二数目个网络层,作为第二网络层;
确定所述第二网络层中不符合第二预设条件的网络层,作为第一网络层;
所述获得所述目标神经网络模型中的各个非第一网络层的预设运行方式,包括:
确定所述第二网络层中符合所述第二预设条件的卷积层和/或全连接层,作为第三网络层;
获得所述第三网络层支持的运行方式;使得所述AI芯片基于所述第三网络层支持的运行方式,用所述第三网络层对第二预设测试数据进行多次处理;
获得所述AI芯片每次对所述第二预设测试数据处理完成所用的第二处理时长;
选择第二处理时长最短的运行方式,确定为所述第三网络层的预设运行方式;
确定所述目标神经网络模型中的各个非第一网络层中,除所述第三网络层以外的网络层的预设运行方式为指定运行方式。
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标神经网络模型中符合第一预设条件的网络层,作为第一网络层,包括:
按照网络层连接的先后顺序,确定所述目标神经网络模型中前第一数目个网络层,作为第一网络层。
3.根据权利要求1所述的方法,其特征在于,所述第二预设条件包括以下至少之一:
输入通道个数为第三数目;
卷积核个数为第四数目。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一网络层为卷积层和/或全连接层。
5.根据权利要求1所述的方法,其特征在于,在所述选择第一处理时长最短的组合中包括的运行方式,确定为基于所述目标神经网络模型对数据进行处理时,所述AI芯片的运行方式之后,所述方法还包括:
生成网络模型文件,以使所述AI芯片按照所述网络模型文件对非测试数据进行处理;其中,所述网络模型文件包括所述目标神经网络模型,以及,所述目标神经网络模型中各个网络层,与所述第一处理时长最短的组合中包括的运行方式的对应关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010462971.3/1.html,转载请声明来源钻瓜专利网。