[发明专利]基于神经网络相似度建模的实时DNN调度系统及方法有效

专利信息
申请号: 202110708893.5 申请日: 2021-06-25
公开(公告)号: CN113485801B 公开(公告)日: 2023-07-28
发明(设计)人: 朱宗卫;刘伟鸿;周学海;李曦;王超 申请(专利权)人: 中国科学技术大学苏州高等研究院
主分类号: G06F9/48 分类号: G06F9/48;G06N3/02;G06N3/08;G06N5/04
代理公司: 苏州创元专利商标事务所有限公司 32103 代理人: 范晴;孙佳佳
地址: 215123 江苏省苏州市苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 神经网络 相似 建模 实时 dnn 调度 系统 方法
【权利要求书】:

1.基于神经网络相似度建模的实时DNN调度系统,其特征在于,包括:

DNN特征提取模块,对DNN网络结构进行提取分析和判断,根据判断结果将需要预测的网络结构特征发送到DNN性能表征模块,其余无需预测的网络结构特征发送到调度模块;

DNN性能表征模块,对网络结构特征进行性能预测,预测其在每个设备上的运行时间,经过目标微调后,发送到调度模块;

调度模块,对每个任务已知的性能表征进行调度,以确保任务以最小的等待时间在最大截止时间之前完成;

所述DNN特征提取模块包括:

网络结构分析器,对神经网络进行离线分析,得到与性能表征相关的网络结构特征,通过特征提取方法实现对神经网络计算任务的建模分析;随后针对所得到的特征,提取关键特征,并在关键特征上实现单一设备的网络性能表征预测;

结构检查器,根据网络结构分析器提取的网络结构特征选择网络性能预测策略,网络结构分析器采用皮尔森系数分析和多次残差拟合提取关键特征;结构检查器通过网络的总计算量来判断网络的规模,并对不同规模的网络采用不同的预测策略;小型网络根据网络参数的数量、层数和计算量来得到其在每个设备上的性能表征的传统模型,并使用线性回归模型进行预测;其他网络由运行时性能描述模块预测;

所述DNN性能表征模块,包括:

网络特征数据库,负责维护大中型网络的结构数据,通过维护网络特征数据库形成反馈数据流,以便在推理过程中提供反馈条件;

性能表征网络,用于基于神经网络相似度建模对异构设备上网络的性能表征进行预测;

时间微调器,用于在线微调预测结果的精度,通过自动选择网络特征拟合预测残差,使预测结果更接近实际运行时间;

所述调度模块,包括:

收集器,对于大中型网络,直接收集DNN 性能预测模型预测的结果作为任务运行时间预测;对于小型网络,收集器使用传统的预测模型来预测它们的运行时间;收集器将任务性能表征预测的结果传递到调度矩阵中,并将其传递给任务调度器进行调度;

任务调度器,根据从收集器获得的调度矩阵生成调度策略,使用添加限制的最小松弛优先调度LLF,对任务进行调度,在保证最大任务接受率的同时最小化等待时间。

2.基于神经网络相似度建模的实时DNN调度方法,其特征在于,包括步骤:

S1、在DNN特征提取模块,对DNN网络结构进行提取分析和判断,根据判断结果将需要预测的网络结构特征发送到DNN性能表征模块,其余无需预测的网络结构特征发送到调度模块;

采用网络结构分析器对神经网络进行离线分析,得到与性能表征相关的网络结构特征;通过特征提取方法实现对神经网络计算任务的建模分析;

随后针对所得到的特征,提取关键特征,并在关键特征上实现单一设备的网络性能表征预测;

并采用结构检查器,根据网络结构分析器提取的网络结构特征选择网络性能预测策略;

网络结构分析器采用皮尔森系数分析和多次残差拟合提取关键特征;

结构检查器通过网络的总计算量来判断网络的规模,并对不同规模的网络采用不同的预测策略;小型网络根据网络参数的数量、层数和计算量来得到其在每个设备上的性能表征的传统模型,并使用线性回归模型进行预测;其他网络由运行时性能描述模块预测;

S2、在DNN性能表征模块中,对网络结构特征进行性能预测,预测其在每个设备上的运行时间,经过目标微调后,发送到调度模块;

采用网络特征数据库维护大中型网络的结构数据,通过维护网络特征数据库形成反馈数据流;

采用性能表征网络基于神经网络相似度建模对异构设备上网络的性能表征进行预测;

采用时间微调器通过自动选择网络特征拟合预测残差,使预测结果更接近实际运行时间;

S3、在调度模块中,对每个任务已知的性能表征进行调度,以确保任务以最小的等待时间在最大截止时间之前完成;

收集器将任务建模结果集成为后续调度单元的调度矩阵,并将其传递给任务调度器进行调度;

任务调度器根据从收集器获得的调度矩阵生成调度策略,在保证接受率的前提下使任务等待时间最小化;

收集器对于大中型网络,直接收集DNN性能预测模型预测的结果作为任务运行时间预测;对于小型网络,收集器使用传统的预测模型来预测它们的运行时间;最后,收集器将任务性能表征预测的结果传递到调度矩阵中,并将其传递给任务调度器进行调度;

任务调度器,使用添加限制的最小松弛优先调度LLF,对任务进行调度,在保证最大任务接受率的同时最小化等待时间。

3.根据权利要求2所述的基于神经网络相似度建模的实时DNN调度方法,其特征在于,步骤S2中,网络特征数据库基于反馈数据流,设计调度系统的反馈学习算法,其中学习机制分为两部分:在线微调机制和离线再培训模式;性能表征网络基于神经网络相似度建模,具有自注意模块,作为预测DNN网络性能的一种方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学苏州高等研究院,未经中国科学技术大学苏州高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110708893.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top