[发明专利]一种基于神经网络的语音识别方法及装置在审
申请号: | 201811212495.9 | 申请日: | 2018-10-18 |
公开(公告)号: | CN109147775A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 饶竹一;张云翔 | 申请(专利权)人: | 深圳供电局有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/18;G10L15/26;G06F17/27 |
代理公司: | 深圳汇智容达专利商标事务所(普通合伙) 44238 | 代理人: | 刘波;潘中毅 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音信号 目标语义 语音识别 特征向量矩阵 神经网络 语音帧 卷积神经网络 第三方程序 语音信息库 人工智能 语音命令 分帧 解析 模糊 学习 | ||
本发明提供一种基于神经网络的语音识别方法及装置,所述方法包括对获取的待识别语音信号分帧处理,获得所述待识别语音信号的语音帧特征向量矩阵;利用卷积神经网络对所述语音帧特征向量矩阵进行识别,获得待识别语音信号对应的文字;解析所述待识别语音信号对应的文字得到目标语义;根据所述目标语义,启动与所述目标语义对应的第三方程序。本发明通过人工智能学习的方法进行语音识别,解决了现有技术只能机械地识别语音信息库中已有的信息,无法准确识别一些口音不准或者模糊的语音命令的问题。
技术领域
本发明涉及技术领域,尤其涉及一种基于神经网络的语音识别方法及装置。
背景技术
语音识别由于其重要的理论价值与广阔的应用前景,受到人们的广泛重视。到目前为止,语音识别研究大部分以线性系统理论为基础,主要应用隐马尔可夫模型与动态时间规整等技术。随着研究的逐步深入,人们发现语音是一个复杂的非线性过程,基于线性系统理论的语音识别方法的局限性越来越凸显。语音识别若要取得突破,必须引入非线性理论的方法。近年来,人工神经网络、混沌、分形等非线性理论研究和应用的逐渐深入,将这些理论应用于语音识别成为可能。因此,针对以上问题设计基于神经网络的语音识别方法及装置是十分必要的。
将深度学习用于语音识别,目前己经获得了长足的进步。以下介绍几种深度学习:
深度神经网络(Deep Neural Networks,简称DNNs):该网络提取出的特征有较强的区分性,因此训练出的模型具有较强的区分能力,这种网络通常采用深度信念网络(DeepBelief Network,简称DBN)用作预训练过程,采用DNN-HMM混合网络训练声学模型,在大词汇量语音识别系统中有较广泛的应用。
卷积神经网络(Convolutional Neural Networks,简称CNNs):相比于DNNs,引入了卷积和池化的概念。通过卷积实现对语音特征局部信息的抽取,再通过池化加强模型对特征的鲁棒性。在明显降低模型规模的同时,识别性能更好,且泛化能力更强。
递归神经网络(Recurrent Neural Networks,简称RNN):目前在语音识别领域最常用的深度网络模型是RNN,它是一种序列模型,它在神经网络的基础上,考虑相邻语音帧的隐含层单元之间的连接关系,通过按时间反向传播误差调整网络参数训练网络。RNN的分布式隐藏状态能有效存储之前的信息,并且作为非线性动态系统能够使其隐藏层单元以一种复杂的方式更新,结合了这两种特性,使它能够通过递归层识别潜在的时间依赖关系,进行语音识别的任务。
联结时间分类(Connectionist Temporal Classification,简称CTC):是一种对齐模型,能够将深度网络输出与标签文本对齐,计算所有可能路径的概率和作为整个句子的概率,使用CTC能够使得我们不需要对样本进行预先的分割或者后处理,大幅提高了效率。
然而,目前的语音识别技术只能机械地识别语音信息库中已有的信息,无法准确识别一些口音不准或者模糊的语音命令,因此容易出现误操作或者误识别或者无法识别,从而限制了语音技术的广泛应用,用户体验效果不佳。
发明内容
为解决上述技术问题,本发明提供一种基于神经网络的语音识别方法及装置。
本发明提供的一种基于神经网络的语音识别方法,所述方法包括:
对获取的待识别语音信号分帧处理,获得所述待识别语音信号的语音帧特征向量矩阵;
利用卷积神经网络对所述语音帧特征向量矩阵进行识别,获得待识别语音信号对应的文字;
解析所述待识别语音信号对应的文字得到目标语义;
根据所述目标语义,启动与所述目标语义对应的第三方程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳供电局有限公司,未经深圳供电局有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811212495.9/2.html,转载请声明来源钻瓜专利网。