[发明专利]异构计算方法和系统有效
申请号: | 202110332343.8 | 申请日: | 2021-03-29 |
公开(公告)号: | CN112925741B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 谭黎敏;宋捷;罗治松 | 申请(专利权)人: | 上海西井信息科技有限公司 |
主分类号: | G06F15/78 | 分类号: | G06F15/78;G06F15/177;G06N3/04 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 夏彬 |
地址: | 200050 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算方法 系统 | ||
本发明提供了一种异构计算方法和系统,该方法包括:SoC控制单元在PC机侧的内存中分配解码单元缓冲池;SoC控制单元在PC机侧的内存中为各个FPGA计算单元分别分配计算单元缓冲池;SoC控制单元获取待处理的视频,并对待处理的视频进行解码;SoC控制单元将解码数据上传至所对应的解码单元缓冲池;SoC控制单元将解码单元缓冲池中解码数据的指针和神经网络加速处理指令发送至FPGA计算单元;FPGA计算单元根据解码数据的指针从解码单元缓冲池中获取解码数据,根据处理指令对解码数据进行神经网络加速处理,并将处理结果上传至计算单元缓冲池。本发明实现端到端的边缘计算,无需依赖云端部署,具有低功耗和高功耗能效比的优势。
技术领域
本发明涉及芯片技术领域,尤其涉及一种异构计算方法和系统。
背景技术
人工智能(Artificial Intelligence),英文缩写AI。人工智能包含了很多不同的领域,如机器学习,计算机视觉等等。深度学习硬件平台常见的异构计算系统包括CPU+GPU、CPU+FPGA组成的异构计算单元。异构计算技术是将不同类型的体系架构协同计算、彼此加速,从而发挥各自系统的优势。现有技术中异构计算系统往往存在功耗大和功耗能效比低的问题,并且现有技术中的异构计算系统往往需要依赖于云端部署。
发明内容
针对现有技术中的问题,本发明的目的在于提供一种异构计算方法和系统,实现端到端的边缘计算,无需依赖云端部署,具有低功耗和高功耗能效比的优势。
本发明实施例提供一种异构计算方法,包括:
SoC控制单元在PC机侧的内存中分配解码单元缓冲池;
所述SoC控制单元在PC机侧的内存中为各个FPGA计算单元分别分配计算单元缓冲池,所述FPGA计算单元通信配置为通过PCI总线与所述SoC控制单元通信;
所述SoC控制单元获取待处理的视频,并对所述待处理的视频进行解码,得到解码数据;
所述SoC控制单元将解码数据上传至所对应的解码单元缓冲池;
所述SoC控制单元将所述解码单元缓冲池中解码数据的指针和神经网络加速处理指令发送至所对应的FPGA计算单元;
所述FPGA计算单元根据所述解码数据的指针从所述解码单元缓冲池中获取解码数据,根据所述处理指令对解码数据进行神经网络加速处理,并将处理结果上传至所对应的计算单元缓冲池。
在一些实施例中,所述SoC控制单元获取待处理的视频,包括如下步骤:
所述SoC控制单元接收到视频源地址和视频处理任务信息;
所述SoC控制单元根据所述视频源地址获取待处理的视频。
在一些实施例中,所述SoC控制单元将所述解码单元缓冲池中解码数据的指针和处理指令发送至所对应的FPGA计算单元,包括如下步骤:
所述SoC控制单元根据所述视频处理任务信息为与其连接的各个FPGA计算单元分配神经网络加速处理任务;
所述SoC控制单元将所述神经网络加速处理任务所对应的解码数据的指针和神经网络加速处理指令发送至所对应的FPGA计算单元。
在一些实施例中,所述SoC控制单元根据所述视频处理任务信息为与其连接的各个FPGA计算单元分配神经网络加速任务,包括如下步骤:
所述SoC控制单元获取所述各个FPGA计算单元的能力级数据和状态数据;
所述SoC控制单元基于所述FPGA计算单元的能力级数据和状态数据,根据所述视频处理任务信息生成多个神经网络加速任务,并分配给所述FPGA计算单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海西井信息科技有限公司,未经上海西井信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110332343.8/2.html,转载请声明来源钻瓜专利网。