[发明专利]一种基于国产众核处理器的深度学习算法实现方法与平台在审
申请号: | 201710353067.7 | 申请日: | 2017-05-18 |
公开(公告)号: | CN107085743A | 公开(公告)日: | 2017-08-22 |
发明(设计)人: | 王明清;刘姝;黄雪;董昊 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/08 |
代理公司: | 济南舜源专利事务所有限公司37205 | 代理人: | 刘晓政 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 国产 处理器 深度 学习 算法 实现 方法 平台 | ||
1.一种基于国产众核处理器的深度学习算法实现方法,其特征在于:深度学习算法的数据并行方式通过主从模式完成,包括以下步骤:
S1:将网络模型复制成n份,训练样本均分成n份;
S2:第i份网络模型利用第i个训练样本子集做迭代训练;
S3:每次迭代完成时,将参数梯度上传至参数服务器;
S4:下次迭代开始前从参数服务器下载参数集作为本次迭代的初始参数。
2.如权利要求1所述的一种基于国产众核处理器的深度学习算法实现方法,其特征在于:集群中的其他计算资源负责不同数据分片的训练工作,计算出参数封信的梯度,传送给参数服务器更新模型参数。
3.如权利要求1或2所述的一种基于国产众核处理器的深度学习算法实现方法,其特征在于:所述参数服务器由单个核组构成,负责merge操作。
4.一种基于国产众核处理器的深度学习算法实现方法,其特征在于:深度学习算法核组间并行方式是由单个训练进程控制单个核组的计算,核组之间的信息交互通过MPI信息传递接口实现。
5.如权利要求4所述的一种基于国产众核处理器的深度学习算法实现方法,其特征在于:所述MPI主进程控制参数服务器,其他计算核组由MPI从进程控制。
6.如权利要求4或5所述的一种基于国产众核处理器的深度学习算法实现方法,其特征在于:所述MPI的设计方式为各进程同步执行或不同进程异步执行。
7.如权利要求6所述的一种基于国产众核处理器的深度学习算法实现方法,其特征在于:通过国产众核处理器中众核的核心数目并行加速热点函数的数据并行从而实现从核间的数据并行。
8.一种基于上述深度学习算法的实现平台,其特征在于:包括硬件集群平台,所述硬件集群平台的各节点内配置相同,计算节点内采用核心数量及主频相同的国产众核处理器。
9.如权利要求8所述的一种基于国产众核处理器的深度学习算法实现平台,其特征在于:所述国产众核处理器主存中存放的从核常用变量传输至从核局存中。
10.如权利要求8或9所述的一种基于国产众核处理器的深度学习算法实现平台,其特征在于:其中计算节点的互联、数据的传输采用万兆以太或Infiniband高度互联网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710353067.7/1.html,转载请声明来源钻瓜专利网。