[发明专利]一种移动用户深度神经网络计算卸载时延最小化方法有效
申请号: | 202010330804.3 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111741054B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 田贤忠;朱娟;许婷 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | H04L67/10 | 分类号: | H04L67/10;G06N3/04;G06N3/08 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 移动用户 深度 神经网络 计算 卸载 最小化 方法 | ||
1.一种移动用户深度神经网络计算卸载时延最小化方法,其特征在于,所述方法包括如下步骤:
步骤1:将深度神经网络所需的执行时间划分为多个不等长时间段,划分原则是用户移动过程中所连接的基站是否改变,每个基站均部署了云服务器,设定DNN请求发出的时刻为τstart,任务完成的时刻为τend,在这段时间内,用户在每个基站的通信区域内停留的时间即为一个时间段;
步骤2:将DNN模型建模为一张有n个顶点的有向无环图DAG,图中的每一个顶点代表深度神经网络模型中的一层,这一层网络可以选择在本地计算,也可以卸载到边缘云计算;
步骤3:用户完成该DNN任务需要m个时间段,m是需要优化的参数,基于图论的思想,把DNN拓扑图DAG划分为m个分块,记为
SDAG={SDAG1,……,SDAGj,……,SDAGm},
每一个时间段完成一个分块的执行,每一个分块j由移动用户和边缘云服务器协作完成,我们把这一分块再分为两小分块,前一小分块SDAGjl由本地执行,后一小分块SDAGje卸载至边缘云执行;
步骤4:由于边缘云服务器的存储资源是有限的,采取用户按需上传模型,哪几层模型需要在边缘云执行,就把那几层的模型上传到边缘云,因此,用户需上传SDAGje的神经网络模型,为此,重定义
SDAG={SDAG1l,SDAG1e,……,SDAGjl,SDAGje,……,SDAGml,SDAGme}
所有带l下标的分块均在本地执行,所有带e下标的分块均卸载至边缘云服务器执行;
步骤5:根据SDAG,该任务的整体执行流程为:在第一个时间段内,移动用户本地执行SDAG1l,同时把SDAG1e的DNN模型传输给到边缘云服务器,当两者均执行完成后,移动设备将SDAG1l的计算结果传输给边缘云服务器,边缘云服务器执行SDAG1e,当边缘云服务器执行完SDAG1e之后,将最终结果传回给用户,用户接着进入到第二个基站的通信范围,第二个时间段的执行过程以此类推;
步骤6:根据上述步骤所描述,建立DNN卸载过程中时延的数学模型,该时延分为三部分:第一部分为SDAGjl的本地计算,同时还要上传SDAGje的网络模型,这部分的时延取两者中的较大值,数学表达式如下:
其中,为第i层网络在本地计算所需的时间,为第i层网络模型数据在网络中传输所需的时间;
第二部分为Vjt的网络传输时延,数学表达式如下:
其中,Vjt为需要在网络中传输输出数据的DNN层集合,为第i层网络输出数据在网络中传输所需的时间;
第三部分为SDAGje在边缘云服务器中的处理时延,数学表达式如下:
其中,为第i层网络卸载到边缘云的数据在边缘云计算所需的时间;
总时延即为上述三部分的时延之和;
步骤7:用最大流最小割求解一个时间段内的优化问题,要解决的问题是如何最优划分SDAGj以得到SDAGjl和SDAGje,使得执行SDAGj所需的时间最短;
步骤8:从全局最优角度出发,最小化完成整个DNN任务所需的时间段数,即m。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010330804.3/1.html,转载请声明来源钻瓜专利网。