[发明专利]提高深度学习模型预测能力的方法、电子设备和存储介质有效
申请号: | 201910379961.0 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110276096B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 段琳;刘京亮;王国亚 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;张芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提高 深度 学习 模型 预测 能力 方法 电子设备 存储 介质 | ||
1.一种提高深度学习模型预测能力的方法,其特征在于,包括:
向待测试设备发送多组矩阵,以使所述待测试设备对每组所述矩阵中的至少两个矩阵进行矩阵乘运算并输出运算结果,所述运算结果为结果矩阵,其中每组所述矩阵具有不同的维度信息,所述维度信息用于指示矩阵乘运算的运算量和数据量,其中每组所述矩阵包括至少两个矩阵,所述每组矩阵的维度信息包括至少两个矩阵的维度信息;
获取所述待测试设备输出每个所述运算结果的运算时间;
根据所述每组矩阵的维度信息、每组所述矩阵对应的结果矩阵的维度信息,以及所述待测试设备输出每个所述运算结果的运算时间,获取所述待测试设备的roofline模型;
根据待测试深度学习模型的运算量和数据量,以及所述待测试设备的roofline模型,对所述待测试设备进行处理,以提高所述待测试深度学习模型的预测性能,所述待测试设备用于对所述待测试深度学习模型进行运算;
每组所述矩阵中包括第一矩阵和第二矩阵,所述第一矩阵的列数和所述第二矩阵的行数相同;
每组所述矩阵的维度信息包括:所述第一矩阵的维度信息和所述第二矩阵的维度信息;所述获取所述待测试设备的roofline模型,包括:
根据每组所述矩阵中所述第一矩阵的维度信息、所述第二矩阵的维度信息、所述结果矩阵的维度信息,获取每组所述矩阵对应的矩阵乘的运算量和数据量;
根据每组所述矩阵对应的所述矩阵乘的运算量和数据量,获取每组所述矩阵对应的运算强度;
根据每组所述矩阵对应的所述矩阵乘的运算量和所述待测试设备的运算时间,获取每组所述矩阵对应的所述待测试设备的运算性能;
根据每组所述矩阵对应的运算强度和所述待测试设备的运算性能,获取所述待测试设备的roofline模型。
2.根据权利要求1所述的方法,其特征在于,所述向待测试设备发送多组矩阵之前,还包括:
接收多个维度信息,根据所述多个维度信息生成每个所述维度信息对应的每组所述矩阵。
3.根据权利要求1所述的方法,其特征在于,所述获取每组所述矩阵对应的矩阵乘的运算量和数据量,包括:
根据如下公式一获取每组所述矩阵对应的矩阵乘的运算量C:
C=(m×k×n)×a公式一
根据如下公式二获取每组所述矩阵对应的矩阵乘的数据量M:
M=(m×k+k×n+m×n)×b公式二
其中,m为每组所述矩阵中所述第一矩阵的行数,k为每组所述矩阵中所述第一矩阵的列数、所述第二矩阵的行数,n为每组所述矩阵中所述第二矩阵的列数,a和b为常数。
4.根据权利要求1所述的方法,其特征在于,所述获取所述待测试设备的roofline模型之前,还包括:
判断每个所述结果矩阵是否正确;
若否,则将错误的结果矩阵对应的第一矩阵和第二矩阵发送给待测试设备,以使所述待测试设备重新进行矩阵乘运算。
5.根据权利要求2所述的方法,其特征在于,所述第一矩阵的维度信息和所述第二矩阵的维度信息相同;
所述根据所述多个维度信息生成每个所述维度信息对应的每组所述矩阵,包括:
依次接收每个维度信息,生成每个所述维度信息对应的每组所述矩阵,直至接收到的维度信息包括的所述第一矩阵的维度信息与预设维度信息相同;后一次接收到的维度信息包括的所述第一矩阵的维度大于前一次接收到的维度信息包括的所述第一矩阵的维度;
所述向待测试设备发送多组矩阵,包括:
依次向所述待测试设备发送生成的每个维度信息对应的每组所述矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910379961.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种工件模型轮廓线形状自适应分解方法及装置
- 下一篇:掌子面锚杆支护设计方法