[发明专利]基于x86架构的AI芯片任务处理方法和装置有效
申请号: | 202010789760.0 | 申请日: | 2020-08-07 |
公开(公告)号: | CN111949329B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 沈付旺 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/445 | 分类号: | G06F9/445;G06F8/41 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 杨帆;宋薇薇 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 x86 架构 ai 芯片 任务 处理 方法 装置 | ||
本发明涉及一种基于x86架构的AI芯片任务处理方法和装置。所述方法包括:更改内核配置文件,并基于更改的内核配置文件对x86系统进行内核的重新编译;利用预设编译器版本和库文件对x86系统进行编译环境搭建;在已搭建的编译环境中对AI芯片进行设备注册以生成AI芯片驱动,并将AI芯片驱动挂载到x86系统;获取计算任务,并利用x86系统的运行时程序将计算任务下传至AI芯片驱动;利用AI芯片驱动和计算任务对AI芯片的功能模块进行任务配置和使能直至任务完成。本发明的方案使AI芯片可以运行在x86架构的下的服务器上,并能够处理处理计算任务,扩大了AI芯片的使用范围,为实际的AI芯片设计、测试以及应用提供了不可多得的硬件环境。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于x86架构的AI芯片任务处理方法、装置、计算机设备及存储介质。
背景技术
人工智能作为当前最具潜力的技术已经应用在生活中的方方面面,例如人脸识别、疾病检测、建筑铁路探伤、交通优化、顾客流分析等等;人工智能计算设备AI芯片融合了速度快,能耗少的两大优点,势必成为日后主流的AI计算硬件,并将部署到大量的计算机集群等计算中心和服务器上。
目前,主流AI芯片生产商以及开源项目,大都采用arm架构的CPU与AI芯片进行通信,例如英伟达的深度学习加速器(NVIDIA Deepleaning Accelerate,简称NVDLA)将AI芯片作为平台设备注册到arm系统中;其缺点是局限于单一的平台架构,仅支持arm cpu以及arm linux完成驱动的注册和运行,而对于主流的x86架构的计算机及服务器并不原生支持,极大了限制了AI芯片的使用范围。
发明内容
有鉴于此,有必要针对以上技术问题提供一种基于x86架构的AI芯片任务处理方法、装置、计算机设备及存储介质。
根据本发明的一方面,提供了一种基于x86架构的AI芯片任务处理方法,所述方法包括:
更改内核配置文件,并基于更改的内核配置文件对x86系统进行内核的重新编译;
利用预设编译器版本和库文件对x86系统进行编译环境搭建;
在已搭建的编译环境中对AI芯片进行设备注册以生成AI芯片驱动,并将所述AI芯片驱动挂载到x86系统;
获取计算任务,并利用x86系统的运行时程序将所述计算任务下传至所述AI芯片驱动;
利用所述AI芯片驱动和所述计算任务对AI芯片的功能模块进行任务配置和使能直至任务完成。
在其中一个实施例中,所述更改内核配置文件,并基于更改的内核配置文件对x86系统进行内核的重新编译的步骤包括:
获取底层配置文件,将所述底层配置文件中的drm功能和dma功能均配置为打开;
获取顶层配置文件,将所述顶层配置文件中的dma连续内存分配功能配置为打开;
利用所述底层配置文件和所述顶层配置文件对x86系统进行内核的重新编译。
在其中一个实施例中,其特征在于,所述利用预设编译器版本和库文件对x86系统进行编译环境搭建的步骤包括:
获取x86系统的当前编译器版本,并将所述当前编译器版本与所述预设编译器版本进行比较;
若所述当前编译器版本低于所述预设编译器版本,则将当前编译器版本替换为所述预设编译器版本;
获取jpeg包和png包,并将所述jpeg包和png包添加至x86系统。
在其中一个实施例中,对AI芯片进行设备注册包括:PCI驱动定义、AI芯片ID声明、AI芯片配置、任务队列初始化、AI芯片地址映射、AI芯片中断注册、dma字符设备添加、AI芯片dma连续内存分配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010789760.0/2.html,转载请声明来源钻瓜专利网。