[发明专利]基于AI芯片的数据处理方法及设备有效
申请号: | 201810712195.0 | 申请日: | 2018-06-29 |
公开(公告)号: | CN108985451B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 王奎澎;寇浩锋;包英泽;付鹏;范彦文;周强;周仁义;胡跃祥 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06K9/00;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 柴海平;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ai 芯片 数据处理 方法 设备 | ||
本发明提供一种基于AI芯片的数据处理方法及设备,本发明的方法,通过将AI芯片数据处理流水线分为以下三个阶段的处理:数据采集和预处理,神经网络模型处理,神经网络模型后处理;该三个阶段的处理为并行流水线结构;AI芯片至少包括第一处理器,第二处理器和第三处理器,第一处理器用于数据采集和预处理,第三处理器用于神经网络模型处理,第二处理器用于神经网络模型后处理;第一处理器,第二处理器和第三处理器同时进行该三个阶段的处理,减少了处理器相互等待时间,最大化地实现了各个处理器的并行计算,提高了AI芯片数据处理的效率,从而可以提高AI芯片的帧率。
技术领域
本发明涉及AI芯片技术领域,尤其涉及一种基于AI芯片的数据处理方法及设备。
背景技术
xeye是一个人工智能摄像机,xeye包括用于采集图像的传感器和用于对图像进行识别处理的AI芯片。AI芯片通常包括用于神经网络模型计算的嵌入式神经网络处理器(Neural-network Processing Unit,简称NPU)和至少两个CPU,其中NPU包括多个核。
现有的AI芯片逐帧地对采集的图像进行识别处理,AI芯片对一个数据帧的处理过程包括以下四个模块:图像采集,图像预处理,神经网络模型处理,神经网络模型后处理及数据传输。CPU用于运行第一和第二模块,NPU用于运行第三模块,CPU还用于运行第四模块。
现有的AI芯片,在对一个图像帧进行识别处理过程中,这四个模块在时序上串行运行,也就是CPU运行第一模块、第二模块或者第四模块期间,NPU处于空闲状态;在NPU运行第三模块期间,CPU处于空闲状态;CPU和NPU相互等待导致计算资源浪费,AI芯片数据处理效率低。
发明内容
本发明提供一种基于AI芯片的数据处理方法及设备,用以解决现有技术中CPU和NPU相互等待导致计算资源浪费,AI芯片数据处理效率低的问题。
本发明的一个方面是提供一种基于AI芯片的数据处理方法,包括:
AI芯片至少包括第一处理器,第二处理器和第三处理器;
所述AI芯片数据处理流水线分为以下三个阶段的处理:数据采集和预处理,神经网络模型处理,神经网络模型后处理;所述三个阶段的处理为并行流水线结构;
所述第一处理器用于数据采集和预处理,所述第三处理器用于神经网络模型处理,所述第二处理器用于神经网络模型后处理;
所述第一处理器,第二处理器和第三处理器同时进行所述三个阶段的处理。
本发明的另一个方面是提供一种AI芯片,至少包括:第一处理器,第二处理器,第三处理器,存储器,以及存储在所述存储器上的计算机程序;
所述AI芯片数据处理流水线分为以下三个阶段的处理:数据采集和预处理,神经网络模型处理,神经网络模型后处理;所述三个阶段的处理为并行流水线结构;
所述第一处理器,第二处理器和第三处理器运行所述计算机程序时实现上述所述的基于AI芯片的数据处理方法。
本发明的另一个方面是提供一种智能摄像机,包括:传感器和AI芯片;
所述AI芯片至少包括:第一处理器,第二处理器,第三处理器,存储器,以及存储在所述存储器上的计算机程序;
所述AI芯片数据处理流水线分为以下三个阶段的处理:数据采集和预处理,神经网络模型处理,神经网络模型后处理;所述三个阶段的处理为并行流水线结构;
所述第一处理器,第二处理器和第三处理器运行所述计算机程序时实现上述所述的基于AI芯片的数据处理方法。
本发明的另一个方面是提供一种计算机可读存储介质,存储有计算机程序,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810712195.0/2.html,转载请声明来源钻瓜专利网。