[发明专利]一种针对停顿的语音识别方法和装置有效
申请号: | 201510982887.3 | 申请日: | 2015-12-23 |
公开(公告)号: | CN105427870B | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 曹松军 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L15/04 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 停顿 语音 识别 方法 装置 | ||
1.一种针对停顿的语音识别方法,包括:
接收一帧或多帧语音信号;
识别所述一帧或多帧语音信号中的静音信号;
当识别成功时,去除所述静音信号;
对去除静音信号的一帧或多帧语音信号进行语音识别,获得识别结果。
2.如权利要求1所述的方法,其特征在于,所述识别所述一帧或多帧语音信号中的静音信号的步骤包括:
查找预先基于静音信号生成的声学模型;
判断所述语音信号与所述声学模型是否匹配;若是,则确定所述语音信号为静音信号。
3.如权利要求2所述的方法,其特征在于,所述声学模型表征为多个状态;
所述判断所述语音信号与声学模型是否匹配的步骤包括:
提取所述语音信号的语音特征;
计算所述语音特征属于所述状态的后验概率;
当所述后验概率大于预设的概率阈值时,确认所述语音信号与所述声学模型匹配。
4.如权利要求3所述的方法,其特征在于,所述声学模型为隐马尔可夫模型,所述隐马尔可夫模型具有5个状态;
所述计算所述语音特征属于所述状态的后验概率的步骤包括:
计算所述语音特征属于第2个状态、第3个状态和第4个状态中的至少一个状态的后验概率。
5.如权利要求4所述的方法,其特征在于,所述语音特征为滤波器组特征;
所述计算所述语音特征属于第2个状态、第3个状态和第4个状态中的至少一个状态的后验概率的步骤包括:
将所述滤波器组特征输入预设的深度神经网络模型,计算所述滤波器组特征属于第2个状态、第3个状态和第4个状态中的至少一个状态的后验概率。
6.一种针对停顿的语音识别装置,包括:
语音信号接收模块,适于接收一帧或多帧语音信号;
静音信号识别模块,适于识别所述一帧或多帧语音信号中的静音信号;
静音信号去除模块,适于在识别成功时,去除所述静音信号;
语音识别模块,适于对去除静音信号的一帧或多帧语音信号进行语音识别,获得识别结果。
7.如权利要求6所述的装置,其特征在于,所述静音信号识别模块还适于:
查找预先基于静音信号生成的声学模型;
判断所述语音信号与所述声学模型是否匹配;若是,则确定所述语音信号为静音信号。
8.如权利要求7所述的装置,其特征在于,所述声学模型表征为多个状态;
所述静音信号识别模块还适于:
提取所述语音信号的语音特征;
计算所述语音特征属于所述状态的后验概率;
当所述后验概率大于预设的概率阈值时,确认所述语音信号与所述声学模型匹配。
9.如权利要求8所述的装置,其特征在于,所述声学模型为隐马尔可夫模型,所述隐马尔可夫模型具有5个状态;
所述静音信号识别模块还适于:
计算所述语音特征属于第2个状态、第3个状态和第4个状态中的至少一个状态的后验概率。
10.如权利要求9所述的装置,其特征在于,所述语音特征为滤波器组特征;
所述静音信号识别模块还适于:
将所述滤波器组特征输入预设的深度神经网络模型,计算所述滤波器组特征属于第2个状态、第3个状态和第4个状态中的至少一个状态的后验概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510982887.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音记录系统及语音记录方法
- 下一篇:语音遥控方法和装置