[发明专利]一种FPGA云平台加速资源的分配方法与系统有效
申请号: | 201910895899.0 | 申请日: | 2019-09-21 |
公开(公告)号: | CN110618871B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 任智新;樊嘉恒 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 李修杰 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 fpga 平台 加速 资源 分配 方法 系统 | ||
本发明提供了一种FPGA云平台加速资源的分配方法与系统,本发明根据用户主机与部署在各网段的FPGA加速卡之间的延时来进行加速卡资源的分配与协调,当用户申请使用FPGA时,将FPGA资源池内与主机延时最小的FPGA加速卡分配给用户,从而实现FPGA云平台加速资源的分配;云监控管理平台可根据FPGA资源池中每块FPGA板卡的地理位置的不同,得到与虚拟机网络之间的传输延时,将延时最小的板卡分配各用户使用,另外可有效防止未被授权的用户随意访问资源池中的加速资源,保护了资源池所有者的有效权益。通过本发明,既有效地保护了未授权给用户使用的FPGA加速卡,又能保证分配给用户的板卡的网络延时最小,达到最优的加速效果,提升用户体验。
技术领域
本发明涉及数据中心技术领域,特别是一种FPGA云平台加速资源的分配方法与系统。
背景技术
随着“云数智”的快速发展,数据体量的急剧膨胀,数据中心对计算的需求也在迅猛上涨。诸如深度学习在视频转码、图片压缩解压缩以及基因检测等各类应用对计算的需求已远远超出了传统CPU处理器的能力所及。
为了弥补需求和性能之间的缺口,业界开始通过硬件加速,也就是采用专用协处理器的异构计算方式来提升处理性能。而随着FPGA处理能力的不断增强,越来越多的数据中心开始使用FPGA进行加速,如微软、亚马逊、BAT等公司的数据中心都大规模部署了FPGA计算卡,以同时提高强大的计算能力和足够的灵活性。为了管理这些数量和种类越来越多的FPGA加速卡,FPGA云平台应用而生,以期解决当前企业面临的FPGA加速卡部署、维护和管理难的问题。在云平台的管理下,将复杂的计算任务分配给FPGA资源池中的某一个或者某几个FPGA中进行加速,加速卡之间通过以太网进行数据传输。
在目前的技术中,对于单机单卡或者单机多卡的使用场景(每台服务器配一块或者多块FPGA加速卡),不存在资源管理和调度的问题,CPU的加速任务直接卸载给加速卡即可。而目前正在兴起的FPGA云平台场景,是在一个FPGA盘柜内部署多张板卡,资源管理平台根据当前FPGA资源的使用和占用情况,按需分配即可。
现有的解决方案在目前FPGA加速卡的规模不大以及所有资源都在一个机柜内或者都是通过一个网络交换机进行数据交换的场景下是合适的。但是随着FPGA加速卡数量的不断增加以及数据中心地理位置的改变,成千上万块的板卡部署在不同的盘柜,不同的机房会有不同程度的网络延时,使用FPGA进行加速就是期望能更快的得到计算结果,如果在计算能力相同的情况下,用户肯定希望能选择网络传输延时最小的加速卡进行加速任务,以得到最好的加速效果。
发明内容
本发明的目的是提供一种FPGA云平台加速资源的分配方法与系统,旨在解决现有技术中FPGA加速卡数量众多造成网络延时不一,导致加速效果差的问题,实现保证分配给用户的板卡的网络延时最小,达到最优的加速效果,提升用户体验。
为达到上述技术目的,本发明提供了一种FPGA云平台加速资源的分配方法,所述方法包括以下步骤:
S1、用户请求使用FPGA加速卡,向云监控管理平台发起分配资源的请求;
S2、云监控管理平台通知虚拟机以广播的方式发送只用于测试延时的数据包;
S3、资源池内的FPGA加速卡识别该数据包,并反馈FPGA标识信息至发起广播数据包的虚拟机;
S4、虚拟机将反馈的FPGA标识信息按顺序写入内存缓存中,将最先回应的反馈数据包保存至队列的第一个位置,并将其反馈给云监控管理平台;
S5、云监控管理平台按照协议解析该反馈数据包,获取与虚拟机网络延时最小的FPGA板卡信息,并将其生成授权文件发送给用户,用户根据授权文件操作该FPGA板卡。
优选地,所述FPGA标识信息包括虚拟ID以及虚拟物理地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910895899.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种深度学习训练任务的工作方法及装置
- 下一篇:混合内存动态调度方法及系统