[发明专利]深度神经网络的构建方法及系统有效

申请号：	201310755400.9	申请日：	2013-12-31
公开（公告）号：	CN104751227A	公开（公告）日：	2015-07-01
发明（设计）人：	潘嘉;何婷婷;刘聪;王智国;胡国平;张仕良;胡郁	申请（专利权）人：	安徽科大讯飞信息科技股份有限公司
主分类号：	G06N3/08	分类号：	G06N3/08;G10L15/16;G10L15/06
代理公司：	北京维澳专利代理有限公司 11252	代理人：	王立民;吉海莲
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	深度神经网络构建方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及信号处理领域，尤其涉及一种深度神经网络的构建方法及系统。

背景技术

语音识别即让机器听懂人说的话，将语音信号转化为计算机可识别的输入。近20年来语音识别技术取得了显著成效，开始从实验室走向市场。目前基于语音识别技术的语音输入，语音检索，语音翻译等得到了广泛的运用。随着科技的进步，信息的爆炸性增长，可以获得的语音数据也越来越多，如何利用海量的数据训练一个语音识别系统，使语音识别率达到更高是实际应用中的一项难题。

传统自动连续语音识别系统主要采用基于隐马尔科夫模型(Hidden Markov Model,HMM)和高斯混合模型(Gaussian Mixture Model,GMM)的GMM-HMM语音识别系统。GMM-HMM语音识别系统使用HMM对语音信号的时序结构进行建模，每个HMM状态的输出概率采用混合高斯模型模拟。近年来基于深度神经网络（Deep Neural Networks,DNN）和隐马尔科夫模型的DNN-HMM语音识别系统受到研究人员越来越多的关注，DNN-HMM系统采用DNN替代GMM模拟每个HMM状态的输出概率。相比于GMM模型，DNN模型的描述能力更强，能够更好地模拟非常复杂的数据分布，并且能够很好地学习到数据上下文的信息，因此相对于GMM-HMM系统，DNN-HMM系统能够取得显著的性能提升。

然而尽管DNN-HMM系统在性能上具有明显优势，但在实际应用中依然较难推广，主要原因在于DNN-HMM的模型复杂度较高，模型训练和解码时所需时间均远远超出了GMM-HMM系统。比如通常情况下DNN模型中隐含层个数至少有6个，且每个隐含层的节点个数都由系统预先设定相同数值，如2048或者2560个节点。显然所述模型的拓扑结构较为复杂且模型参数众多，给大数据库上的模型训练及后续语音解码带来较大的运算压力，导致系统运行效率过慢，不利于系统实用化的推广和更新。

发明内容

本发明的目的在于克服现有技术中的不足，提供一种深度神经网络的构建方法及系统，通过对各隐含层的节点个数的有效控制，大大减少了深度神经网络中节点的冗余性。

为实现上述目的，本发明的技术方案是：

一种深度神经网络的构建方法，包括：

确定深度神经网络输入层的节点个数和输出层的节点个数；

获取训练数据；

确定深度神经网络隐含层的层数和第一层隐含层的节点个数：

根据所述训练数据的数据量、隐含层的层数和第一层隐含层的节点个数，确定后续隐含层的节点个数，并使不同隐含层的节点个数呈递减变化；

利用所述训练数据确定所述深度神经网络的模型参数得到深度神经网络。

优选地，所述确定后续隐含层的节点个数，并使不同隐含层的节点个数呈递减变化包括：

根据所述训练数据的数据量确定递减方式及递减比例；

按照确定的递减方式及递减比例确定后续隐含层的节点个数。