[发明专利]语音识别方法和装置有效
申请号: | 201410129541.4 | 申请日: | 2014-04-01 |
公开(公告)号: | CN103915092B | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 李博;王志谦;胡娜;穆向禹;贾磊;魏伟 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
1.一种语音识别方法,其特征在于,包括:
采集用户输入的语音信息;
对所述语音信息进行特征提取,得到特征信息;
对所述特征信息进行过滤,得到过滤后的特征信息;
根据预先获取的声学模型和语言模型,对所述过滤后的特征信息进行解码,得到识别后的语音信息,其中,所述声学模型为预先进行数据压缩后得到的;
所述根据预先获取的声学模型和语言模型,对所述过滤后的特征信息进行解码,得到识别后的语音信息,包括:
采用与所述声学模型的数据压缩算法一致的算法,对所述过滤后的特征信息进行数据压缩,根据所述数据压缩过的声学模型,对数据压缩后的特征信息进行计算,得到声学模型打分;
根据语言模型,对声学模型打分后的数据进行运算,得到语言模型打分,其中,根据语言模型,以及声学模型中每个字对应的得分,得到对应的字的语言模型打分;
根据所述声学模型打分和所述语言模型打分,得到识别后的语音信息,其中,根据所述声学模型打分和所述语言模型打分,得到结合后的打分,将最高的结合后的打分对应的文字片断,确定为语音识别后得到的文字片断;
所述对数据压缩后的特征信息进行计算,包括:
对数据压缩后的特征信息进行并行运算。
2.根据权利要求1所述的方法,其特征在于,所述对所述特征信息进行过滤,包括:
对所述特征信息进行跳帧提取。
3.根据权利要求1所述的方法,其特征在于,所述并行运算包括如下项中的至少一项:
数据并行运算、指令并行运算、线程并行运算。
4.一种语言识别装置,其特征在于,包括:
采集模块,用于采集用户输入的语音信息;
提取模块,用于对所述语音信息进行特征提取,得到特征信息;
过滤模块,用于对所述特征信息进行过滤,得到过滤后的特征信息;
解码模块,用于根据预先获取的声学模型和语言模型,对所述过滤后的特征信息进行解码,得到识别后的语音信息,其中,所述声学模型为预先进行数据压缩后得到的;
所述解码模块具体用于:
采用与所述声学模型的数据压缩算法一致的算法,对所述过滤后的特征信息进行数据压缩,根据所述数据压缩过的声学模型,对数据压缩后的特征信息进行计算,得到声学模型打分;
根据语言模块,对声学模型打分后的数据进行运算,得到语言模型打分,其中,根据语言模型,以及声学模型中每个字对应的得分,得到对应的字的语言模型打分;
根据所述声学模型打分和所述语言模型打分,得到识别后的语音信息,其中,根据所述声学模型打分和所述语言模型打分,得到结合后的打分,将最高的结合后的打分对应的文字片断,确定为语音识别后得到的文字片断;
所述解码模块对数据压缩后的特征信息进行计算,包括:
对数据压缩后的特征信息进行并行运算。
5.根据权利要求4所述的装置,其特征在于,所述过滤单元具体用于:
对所述特征信息进行跳帧提取。
6.根据权利要求4所述的装置,其特征在于,所述解码模块进行的并行运算具体包括如下项中的至少一项:
数据并行运算、指令并行运算、线程并行运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410129541.4/1.html,转载请声明来源钻瓜专利网。