[发明专利]语音识别方法和装置有效
申请号: | 201510925644.6 | 申请日: | 2015-12-14 |
公开(公告)号: | CN105529027B | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 钱胜;潘复平 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L19/008;G10L15/26 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
本发明提出一种语音识别方法和装置,其中,该语音识别方法,包括以下步骤:接收语音信号;根据预先建立的声学模型、语言模型和解码网络对所述语音信号进行解码,并在解码过程中动态添加空白单元,以得到添加空白单元后的最优解码路径,其中,所述声学模型是基于连接时序分类训练得到的,所述声学模型中包括基本发音单元和所述空白单元,所述解码网络由所述基本发音单元构成的多个解码路径组成;将所述最优解码路径输出为所述语音信号的识别结果。本发明的语音识别方法,能够提高语音识别的准确性,并提高识别过程中的解码速度。
技术领域
本发明涉及语音识别技术领域,特别涉及一种语音识别方法和装置。
背景技术
传统的语音识别技术,大多是基于状态建模的语音识别模型进行语音识别的。例如,基于隐马尔科夫模型(Hidden Markov Model;以下简称:HMM)进行语音识别。HMM可以看作一个数学上的双重随机过程:一个是用具有有限状态数的马尔科夫Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与马尔科夫Markov链的每一个状态相关联的观测序列的随机过程。在这种建模方式中,一个音素或者一个音节被认为可分为多个没有物理意义的状态,然后采用离散或者连续高斯模型或深度学习模型描述每个状态的输出分布。但是,基于状态建模的方式,在语音识别的过程中,在对两个发音单元之间处进行识别时,容易出现混淆,识别性能较差。
发明内容
本发明旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一个目的在于提出一种语音识别方法,能够提高语音识别的准确性,并提高识别过程中的解码速度。
本发明的第二个目的在于提出一种语音识别装置。
为达上述目的,根据本发明第一方面实施例提出了一种语音识别方法,包括以下步骤:接收语音信号;根据预先建立的声学模型、语言模型和解码网络对所述语音信号进行解码,并在解码过程中动态添加空白单元,以得到添加空白单元后的最优解码路径,其中,所述声学模型是基于连接时序分类训练得到的,所述声学模型中包括基本发音单元和所述空白单元,所述解码网络由所述基本发音单元构成的多个解码路径组成;将所述最优解码路径输出为所述语音信号的识别结果。
本发明实施例的语音识别方法,基于连接时序分类构建的声学模型和解码网络对语音信号进行解码,并在解码过程中动态添加空白单元,以得到添加空白单元后的最优解码路径,并作为语音信号的识别结果,能够解决两个发音单元中间出现混淆的问题,提高语音识别的准确性,并能够有效减少可能的解码路径,提高识别过程中的解码速度。
本发明第二方面实施例提出了一种语音识别装置,包括:接收模块,用于接收语音信号;解码模块,用于根据预先建立的声学模型、语言模型和解码网络对所述语音信号进行解码,并在解码过程中动态添加空白单元,以得到添加空白单元后的最优解码路径,其中,所述声学模型是基于连接时序分类训练得到的,所述声学模型中包括基本发音单元和所述空白单元,所述解码网络由所述基本发音单元构成的多个解码路径组成;输出模块,用于将所述最优解码路径输出为所述语音信号的识别结果。
本发明实施例的语音识别装置,基于连接时序分类构建的声学模型和解码网络对语音信号进行解码,并在解码过程中动态添加空白单元,以得到添加空白单元后的最优解码路径,并作为语音信号的识别结果,能够解决两个发音单元中间出现混淆的问题,提高语音识别的准确性,并能够有效减少可能的解码路径,提高识别过程中的解码速度。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的语音识别方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510925644.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便携式音乐播放器
- 下一篇:语音识别装置和语音识别方法