[发明专利]深度学习神经网络训练方法、层数调整装置和机器人系统在审
申请号: | 201711330260.5 | 申请日: | 2017-12-13 |
公开(公告)号: | CN108171329A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 朱定局 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 吴平 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 学习神经网络 训练结果 机器人系统 调整装置 预设条件 隐层 信息符合 训练过程 分类器 输出层 输入层 成功率 返回 更新 成功 | ||
本发明涉及一种深度学习神经网络训练方法、层数调整装置和机器人系统。该方法包括:获取训练输入数据;将训练输入数据输入当前深度学习神经网络进行训练得到训练结果信息,当前深度学习神经网络包括输入层、隐层、分类器和输出层;若训练结果信息不符合预设条件,则调整当前深度学习神经网络中隐层的层数以更新当前深度学习神经网络,并返回将训练输入数据输入当前深度学习神经网络进行训练,得到训练结果信息的步骤;否则将当前深度学习神经网络作为训练后的深度学习神经网络。如此,通过在训练过程中根据训练结果信息进行隐层层数的调整,直至训练结果信息符合预设条件,可确保深度学习神经网络的训练成功,训练成功率高。
技术领域
本发明涉及机器学习技术领域,特别是涉及一种深度学习神经网络训练方法、层数调整装置和机器人系统。
背景技术
神经网络是一种进行分布式并行信息处理的算法数学模型,常用于智能机器识别,深度学习神经网络可采用样本数据进行深度学习。其中,深度学习包括有监督学习和无监督学习。
传统技术中,通常是采用样本数据输入固定层数的深度学习神经网络进行无监督学习、采用带有标签的样本数据输入固定层数的深度学习进行有监督学习得到输出标签,以完成对深度学习神经网络的训练,并在训练后采用测试数据测试通过。例如,输出标签为身份证号码,可以采用头像作为样本数据、输入头像得到该人的身份证号码,或者采用语音作为样本数据、输入语音得到该人的身份证号码。
然而,在有监督学习的过程中,如果深度学习神经网络的层数过少,使得顶层概念过于具体、与输出标签判别无关甚至矛盾的细节,从而使得顶层概念与输出标签不能充分拟合,那会导致样本数据输入后很多得不到正确的输出标签,深度学习神经网络训练失败;而如果深度学习神经网络的层数过多,会使得顶层概念过于抽象、缺少判别的细节,而在有监督学习过程中加入刚好能区分输出标签的“噪音”细节,从而使得顶层概念与输出标签过于拟合,那会导致样本数据输入后都得到正确的输出标签、但测试数据输入后很多得不到正确的输出标签,从而导致了深度学习神经网络训练失败。
发明内容
基于此,有必要针对传统的深度学习神经网络训练成功率低的问题,提供一种可提高训练深度学习神经网络的成功率的深度学习神经网络训练方法、层数调整装置和机器人系统。
一种深度学习神经网络训练方法,包括:
获取训练输入数据;
将所述训练输入数据输入当前深度学习神经网络进行训练,得到训练结果信息,所述当前深度学习神经网络包括输入层、隐层、分类器和输出层;
若所述训练结果信息不符合预设条件,则调整所述当前深度学习神经网络中隐层的层数以更新当前深度学习神经网络,并返回所述将所述训练输入数据输入当前深度学习神经网络进行训练,得到训练结果信息的步骤;
若所述训练结果信息符合所述预设条件,则将所述当前深度学习神经网络作为训练后的深度学习神经网络。
一种层数调整装置,包括:
数据获取模块,用于获取训练输入数据;
网络训练模块,用于将所述训练输入数据输入当前深度学习神经网络进行训练,得到训练结果信息,所述当前深度学习神经网络包括输入层、隐层、分类器和输出层;
层数调整模块,用于在所述训练结果信息不符合预设条件时,调整所述当前深度学习神经网络中隐层的层数以更新当前深度学习神经网络,并返回所述网络训练模块重新将所述训练输入数据输入当前深度学习神经网络进行训练,得到训练结果信息;
训练结束模块,用于在所述训练结果信息符合所述预设条件时,将所述当前深度学习神经网络作为训练后的深度学习神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711330260.5/2.html,转载请声明来源钻瓜专利网。