[发明专利]一种基于SOC的可训练柔性CNN系统设计方法有效
申请号: | 201910416537.9 | 申请日: | 2019-05-17 |
公开(公告)号: | CN110135572B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 姚睿;李明莉;周冠宇;游霞;周翟和;陈燕 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/0464;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211106 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本文发明提供一种基于SOC的可训练柔性CNN系统设计方法,属于深度学习领域,用于实现嵌入式CNN系统的在线学习和结构柔性拓展。该方法首先构建包含学习引擎、前馈加速器和外部接口的CNN片上系统;然后进入在线学习模式,接收外部命令设置网络结构和样本个数,依次加载样本图像和权值数据,在学习引擎的控制下,分时复用前馈加速器,实现CNN网络的前向加速计算,并由学习引擎执行学习规则,推算新权值,依次实现各样本的学习;学习完毕进入预测模式,利用训练所得网络结构和权值参数,对输入图像进行预测。本发明能够实现嵌入式CNN系统的预测、在线学习和结构柔性扩展,且具有低功耗、低成本、高灵活性和强环境适应性等优点。 | ||
搜索关键词: | 一种 基于 soc 训练 柔性 cnn 系统 设计 方法 | ||
【主权项】:
1.一种基于SOC的可训练柔性CNN系统设计方法,其特征在于,包括以下几个步骤:步骤1:利用FPGA片上软核或硬核处理器实现学习引擎,利用FPGA逻辑设计前馈加速器,并设计外部接口模块,构建基于SOC的可训练CNN系统的硬件框架;步骤2:使CNN系统进入在线学习阶段,通过外部接口设置网络结构参数,并初始化训练样本图像个数;步骤3:通过外部接口向CNN系统加载一个训练样本图像,同时初始化待加速网络层数和网络权值;步骤4:在学习引擎的控制下,分时复用前馈加速器,实现图像数据处理的前馈过程加速;步骤5:学习引擎访问最后一个待加速CNN网络层的运算结果,执行输出层,输出执行结果;步骤6:学习引擎根据学习规则,以最优化误差损失为目标函数,推算新权值;步骤7:将步骤6所得新权值作为初始化网络权值,重复步骤3~6,依次学习全部样本;步骤8:使CNN系统进入预测阶段,将步骤7所得最终网络权值作为初始化网络权值,通过外部接口加载待预测图像,重复步骤4~5,输出执行结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910416537.9/,转载请声明来源钻瓜专利网。