[发明专利]自动语音识别期间的选择性噪声抑制有效
申请号: | 201510688605.9 | 申请日: | 2015-10-22 |
公开(公告)号: | CN105551484B | 公开(公告)日: | 2019-09-03 |
发明(设计)人: | G.塔尔瓦;X.赵;R.D.辛斯三世;M.F.R.乔扈里 | 申请(专利权)人: | 通用汽车环球科技运作有限责任公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/20;G10L21/0208;G10L21/0316 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 陈国慧;董均华 |
地址: | 美国密*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动 语音 识别 期间 选择性 噪声 抑制 | ||
本发明提供自动语音识别期间的选择性噪声抑制。描述了一种自动语音识别引擎和使用该引擎的方法。该方法关于前端处理音频信号,并且包括以下步骤:识别音频信号的多个有声帧;确定多个有声帧中的一个或多个具有大于第一预定阈值的信噪比(SNR)数值;以及基于所述确定,对于多个有声帧中的一个或多个回避噪声抑制。
技术领域
本发明涉及自动语音识别期间的选择性噪声抑制。
背景技术
免提计算装置变得越来越流行;尤其是在可以期望语音命令/控制的车辆中-使得能够使用驾驶员的语音控制车辆功能。语音控制系统可以接收驾驶员的语音作为输入,解释语音,并且基于语音的解释而做出逻辑判定(例如执行对车辆功能的控制)。当驾驶员能够采用语音命令模式时,能够将车辆操作期间驾驶员的分心最小化,并且可以防止与分心相关的事故。
当然,在驾驶员试图使用他/她的语音命令车辆并且车辆不响应(或不正确地响应)的情况下,这可能导致驾驶员受挫,并且比如果驾驶员仅手动地执行命令而不试图语音控制的情形最终导致更大的分心。
发明内容
因此本发明的目的在于提高自动语音处理的精度,特别是在车辆环境中。
根据本发明的实施例,提供了一种前端处理音频信号的方法。该方法包括以下步骤:识别音频信号的多个有声帧;确定多个有声帧中的一个或多个具有大于第一预定阈值的信噪比(SNR)数值;并且基于所述确定,对于多个有声帧中的一个或多个回避噪声抑制。
根据本发明的另一实施例,提供了一种预处理音频信号的方法。该方法包括以下步骤:从由自动语音识别(ASR)引擎接收到的音频信号识别多个语音支配帧;将所述多个语音支配帧分类为有声帧和无声帧;对于每个所述有声帧,确定所述有声帧的信噪比(SNR)是否大于预定阈值(TV1);以及对于具有大于所述预定阈值(TV1)的SNR的每个所述有声帧,提供所述有声帧用于下游处理而不进行噪声抑制,并且对于具有小于或等于所述预定阈值(TV1)的SNR的每个所述有声帧,在对所述有声帧执行预处理噪声抑制之后,提供所述有声帧用于下游处理。
1.一种前端处理音频信号的方法,包括以下步骤:
识别音频信号的多个有声帧;
确定所述多个有声帧中的一个或多个具有大于第一预定阈值的信噪比(SNR)数值;以及
基于所述确定,对于所述多个有声帧中的一个或多个回避噪声抑制。
2.根据方案1所述的方法,还包括:
识别音频信号的多个无声帧;
确定所述多个无声帧中的一个或多个具有大于第二预定阈值的SNR数值;以及
基于所述确定,对于所述多个无声帧中的一个或多个回避噪声抑制。
3.根据方案2所述的方法,还包括:对具有小于或等于所述第一预定阈值的SNR的多个有声帧以及对具有小于或等于所述第二预定阈值的SNR的多个无声帧执行噪声抑制。
4.根据方案2所述的方法,其中所述第一预定阈值与所述第二预定阈值相同。
5.根据方案4所述的方法,还包括在前端处理步骤之后执行所述多个有声帧中的一个或多个和所述多个无声帧中的一个或多个的下游处理。
6.根据方案5所述的方法,其中,执行下游处理包括特征提取子级、分类子级、组合子级以及解码子级。
7.根据方案4所述的方法,其中所述第一预定阈值近似为20dB。
8.一种预处理音频信号的方法,包括以下步骤:
从由自动语音识别(ASR)引擎接收到的音频信号识别多个语音支配帧;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用汽车环球科技运作有限责任公司,未经通用汽车环球科技运作有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510688605.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种声音滤噪装置及方法
- 下一篇:一种便于托举琴颈的吉他变调夹