[发明专利]深度神经网络的计算方法、装置及可读存储介质在审
申请号: | 201710544329.8 | 申请日: | 2017-07-05 |
公开(公告)号: | CN107451653A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 谌璟;孙庆新 | 申请(专利权)人: | 深圳市自行科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 深圳市世纪恒程知识产权代理事务所44287 | 代理人: | 胡海国 |
地址: | 518000 广东省深圳市南山区南山街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 神经网络 计算方法 装置 可读 存储 介质 | ||
技术领域
本发明涉及深度神经网络领域,尤其涉及一种深度神经网络的计算方法、装置及可读存储介质。
背景技术
ML(英文全称Machine Learning,译为:机器学习)和AI(英文全称Artificial Intelligence,译为:人工智能)是研究如何让计算机去完成需要人的智力才能胜任的工作,是研究如何应用计算机的软硬件来模拟人类某些行为、思想的基本理论、方法和技术。AI是一门多学科交叉的科学,包含自然科学和社学科学交叉,更涉及哲学和认知科学,数学、神经生理学、心理学、计算机科学,信息科学、控制论等众多学科。
近年来,DL(英文全称Deep Learning,译为:深度学习)进展大大推动了ML和AI的技术进步和实际应用。例如,AI为技术核心的应用已经渗透到了众多领域,安防、教育、金融、医疗、交通等等,典型应用包括:远程开户(金融、证券),智能安防、图像识别、自然语言处理、自动驾驶等等。DL是一种含多隐层的,多层感知的深度学习结构,通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。DNN(英文全称Deep Neural Network,译为:深度神经网络)就是一种深度学习模型。DNN还包括CNN(英文全称:Convolutional Neural Networks,译为:卷积神经网络)和RNN(英文全称:Recurrent neural Network,译为:循环神经网络)等网络架构。
深度学习是模拟人脑的思维方式和处理问题的方法,而人脑的计算神经元数量是百亿量级,即使是一个“小型”的DNN网络所需要的计算也非常庞大,而且几乎所有的深度学习网络均运行在CPU(或CPU集群),或GPU(或GPU集群)硬件平台之上,所需要的硬件资源非常巨大,导致成本和功耗都非常大,运行速度缓慢,无法实时处理。由于以上原因使用FPGA或专用芯片的硬件平台就成为深度学习的发展趋势,但是这些平台大都是硬件逻辑器件,结构固化,难以适用于丰富多变的深度神经网络,造成芯片功能单一,而增加或更改网络需要更多研发成本并造成以前芯片无法升级而浪费。
常用软件方案采用顺序处理状态机控制,只适用于软件实现,需要的硬件资源非常巨大,导致成本和功耗都非常大,运行速度缓慢,无法实时处理。常用软件方案移植到嵌入式硬件平台计算处理速度也很缓慢,而且结构固化,难以适用于丰富多变的深度神经网络,造成芯片功能单一,而增加或更改网络需要更多研发成本并造成以前芯片无法升级而浪费。
传统状态机算法通常是计算到达某一层再临时进行本层参数的计算,再进行解释解码等操作才能进行本层计算及后面的状态跳转,往往需要消耗更多的时间和计算资源,也不利于复杂状态机的设计,不利于硬件资源的充分利用,造成成本提高,运算和处理速度缓慢,无法满足很多项目的实时性需求。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种深度神经网络的计算方法、装置及可读存储介质,旨在解决深度神经网络的计算速度缓慢的技术问题。
为实现上述目的,本发明提供一种深度神经网络的计算方法,所述方法包括:
计算深度神经网络中各层的网络参数,将计算的各层网络参数作为各层的配置参数存入配置文件中;
在深度神经网络进行层次计算时,从所述配置文件中获取所述深度神经网络所计算到的当前层次对应的配置参数;
获取所述当前层次对应的权重数据;
根据获取的配置参数及权重数据,对所述当前层次的输入Map进行计算,获得所述当前层次的输出Map。
优选地,所述计算深度神经网络中各层的网络参数,将计算的各层网络参数作为各层的配置参数存入配置文件中之前,所述方法还包括:
将所述输入Map拆分成第一预设数量的输入子Map;
将所述输入子Map分成第二预设数量组的输入子Map;
相应地,所述根据获取的配置参数及权重数据,对所述当前层次的输入Map进行计算,获得所述当前层次的输出Map,具体包括:
根据所述获取的配置参数及权重数据,对所述当前层次的所述输入子Map按组进行计算,获得所述当前层次的输出子Map;
将所述当前层次的输出子Map拼接成所述当前层次的所述输出Map。
优选地,所述根据所述获取的配置参数及权重数据,对所述当前层次的所述输入子Map按组进行计算,获得所述当前层次的输出子Map,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市自行科技有限公司,未经深圳市自行科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710544329.8/2.html,转载请声明来源钻瓜专利网。