[发明专利]一种DNN分区方法及采用该方法的边缘计算架构和存储介质在审
申请号: | 202111557066.7 | 申请日: | 2021-12-18 |
公开(公告)号: | CN114281535A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 代浩;吴嘉澍;王洋;叶可江;张锦霞;须成忠 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N3/04;G06N3/08 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 刘建伟 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 dnn 分区 方法 采用 边缘 计算 架构 存储 介质 | ||
1.一种DNN分区方法,其特征在于,包括以下步骤:
S1.根据DNN的每一层的计算类型和规模进行抽象,得到DNN的层次架构及总的层数;
S2.利用每秒浮点运算来表征设备和边缘服务器的浮点计算量和计算时间,结合DNN的层数来完成设备与边缘服务器基于DNN分区博弈的数学建模;
S3.以最小化所有设备的总响应时间为目标设计优化目标函数;
S4.基于DNN的分割层为所述设备设计效用函数;
S5.基于博弈论的建模方法,把每个设备看作独立的智能体,每个智能体的目标是通过选择分割层位置来最大化自身的效用函数。
2.根据权利要求1所述的DNN分区方法,其特征在于,在所述分割层以上的DNN部分在所述设备上执行;所述分割层以下的DNN部分在所述边缘服务器上执行。
3.根据权利要求1所述的DNN分区方法,其特征在于,在所述步骤S2中所述边缘服务器分配给所述设备的资源是独占的。
4.根据权利要求1所述的DNN分区方法,其特征在于,在所述步骤S5中,采用动态高效无嫉妒分区算法通过博弈论的建模方法,把每个所述设备看作独立的智能体,使每个所述智能体的目标是通过选择分层位置来最大化自身的效用函数。
5.根据权利要求4所述的DNN分区方法,其特征在于,在所述动态高效无嫉妒分区算法是分布式及增量式算法。
6.一种采用如权利要求1-5任意一项所述的DNN分区方法的边缘计算架构,包括设备和接入所述设备的边缘服务器;其特征在于,所述设备设置为执行器;所述边缘服务器设置为学习器:DNN被分割后分别部署在所述执行器和所述学习器上,通过两者协同完成推理任务;
所述学习器用于运行深层的网络来实现加速;
所述执行器用于执行分割后的一部分所述DNN,得到的输出张量输出给所述学习器。
7.根据权利要求6所述边缘计算架构,其特征在于,所述执行器包括:环境模块、模型模块和存储模块。
8.根据权利要求7所述边缘计算架构,其特征在于,所述学习器包括:模型模块和队列模块。
9.一种计算机可读存储介质,计算机可读存储介质存储有一个或者多个程序,一个或者多个程序可被一个或者多个处理器执行,以实现如上述权利要求1-5任意一项所述的DNN分区方法中的步骤。
10.基于上述权利要求1-5任意一项所述的DNN分区方法,本申请还提供一种终端设备,其特征在于,其包括至少一个处理器、显示屏,以及存储器,还包括通信接口和总线;其中,所述处理器、所述显示屏、所述存储器和所述通信接口通过所述总线完成相互间的通信;所述显示屏设置为显示初始设置模式中预设的用户引导界面;所述通信接口传输信息;所述处理器调用所述存储器中的逻辑指令,以执行上述权利要求1-5任意一项所述的DNN分区方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111557066.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种隧道环向排水系统
- 下一篇:一种基于工业相机的五轴点胶机的误差标定方法