[发明专利]一种CNN模型及其训练方法、终端、计算机可读存储介质在审
申请号: | 201910864377.4 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110598862A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 高岩;姜凯;郝虹;于治楼;李朋 | 申请(专利权)人: | 山东浪潮人工智能研究院有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 37100 济南信达专利事务所有限公司 | 代理人: | 孙园园 |
地址: | 250100 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种CNN模型及其训练方法、终端、计算机可读存储介质,属于CNN模型训练领域,要解决的问题为如何在保证模型训练性能的前提下分批量的实现对大批量样本的分析。其方法包括:在每个批量归一化层和与其相邻的上一个网络层之间插入一个同步层,输入层和与其相邻的同步层之间的所有网络层、以及任意相邻的两个同步层之间的所有网络层分别为一段单独的网络层单元;对于上述所有的网络层单元通过数据分批次的方式逐段进行前向传播。该CNN模型为线性结构,且为上述训练方法训练得到的模型。终端中处理器被配置用于调用所述程序指令执行上述训练方法。计算机可读存储介质中,程序指令当被处理器执行时所述处理器执行上述训练方法。 | ||
搜索关键词: | 网络层 同步层 计算机可读存储介质 处理器执行 模型训练 终端 程序指令执行 程序指令 前向传播 线性结构 归一化 输入层 处理器 逐段 调用 样本 配置 分析 保证 | ||
【主权项】:
1.一种CNN模型的训练方法,其特征在于应用于呈线性结构的CNN模型,且所述CNN模型具有批量归一化层,所述训练方法包括如下步骤:/n在每个批量归一化层和与其相邻的上一个网络层之间插入一个同步层,所述同步层用于暂存与其相邻的上一个网络层的输出、并用于启动与其相邻的批量归一化层对输入数据的批量运算;/n输入层和与其相邻的同步层之间的所有网络层、以及任意相邻的两个同步层之间的所有网络层分别为一段单独的网络层单元;/n对于上述所有的网络层单元通过数据分批次的方式逐段进行前向传播;/n所述通过数据分批次的方式逐段进行前向传播为:对于每个网络层单元,将其输入数据分批次的输入所述网络层单元并暂存于同步层,汇总同步层的输出组成大批量样本,通过对应的批量归一化层对所述大批量样本进行归一化。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮人工智能研究院有限公司,未经山东浪潮人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910864377.4/,转载请声明来源钻瓜专利网。