[发明专利]目标检测算法的硬件架构的资源估算、配置方法及系统有效
申请号: | 201710287107.2 | 申请日: | 2017-04-27 |
公开(公告)号: | CN108804974B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 牛昕宇 | 申请(专利权)人: | 深圳鲲云信息科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 算法 硬件 架构 资源 估算 配置 方法 系统 | ||
本发明提供一种目标检测算法的硬件架构的资源估算、配置方法及系统,提取基于深度学习的目标检测算法所包含的计算层级和每个层级的计算参数;基将基于深度学习的目标检测算法映射至所述基于深度学习的目标检测算法的硬件架构;利用基于深度学习的目标检测算法的硬件架构的资源估算方法,估算映射后的所述基于深度学习的目标检测算法的硬件架构所需的整体资源;计算FPGA所能容纳的最大并行度;基于所述基于深度学习的目标检测算法,根据不同的计算层级,重新配置卷积计算核和全连接计算核。本发明的目标检测算法的硬件架构的资源估算、配置方法及系统能够通过最优化的资源配置实现最优的计算性能大大提升目标检测的实时性。
技术领域
本发明涉及FPGA的技术领域,特别是涉及一种目标检测算法的硬件架构的资源估算、配置方法及系统。
背景技术
现场可编程门阵列(Field-Programmable Gate Array,FPGA)是一种在生产后可编程的集成电路芯片。FPGA芯片中电路提供可编程节点,可根据用户设定重新定义电路逻辑。相比于传统处理芯片CPU,FPGA可提供针对特定问题的高度优化电路,提升百倍级别计算性能。相比于传统集成电路芯片ASIC,FPGA可提供更灵活的计算方案。
目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割,它将目标的分割和识别合二为一。目标检测为机器视觉的一个基础应用。相较于图像识别,目标检测需要在图像中标记物体位置。典型的目标检测算法包括以下两个步骤:
(1)边框收敛
(2)框内物体识别
然而,基于滑动窗口以及区域分割的目标检测算法存在检测准确率低、检测时间长的缺点。因此,基于深度学习的目标检测算法应用而生,如YOLO,Faster R-CNN。深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。因此,基于深度学习的目标检测算法需要大量的计算资源支持。在机器人、无人机、卫星等急需人工智能支持的移动设备中,受限于计算资源与空间,无法支持此类基于深度学习的目标检测算法的实现。
基于FPGA的深度学习算法的硬件定制架构为在功耗、空间资源受限条件下的实时目标检测提供了可能。然而,在实际应用中,对于复杂的目标检测算法,如何在进行硬件架构的资源估计、资源配置,以实现最优的计算性能成为一个热点研究课题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种目标检测算法的硬件架构的资源估算、配置方法及系统,能够在FPGA架构下,对基于深度学习的目标检测算法的硬件架构进行准确有效地资源估计和资源配置,从而通过最优化的资源配置实现最优的计算性能大大提升目标检测的实时性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳鲲云信息科技有限公司,未经深圳鲲云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710287107.2/2.html,转载请声明来源钻瓜专利网。