[发明专利]自适应地检测输入音频信号中的话音活动的方法和设备有效
申请号: | 201080030027.5 | 申请日: | 2010-12-24 |
公开(公告)号: | CN102959625B9 | 公开(公告)日: | 2017-04-19 |
发明(设计)人: | 王喆 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应 检测 输入 音频 信号 中的 话音 活动 方法 设备 | ||
1.一种用于自适应地检测由帧组成的输入音频信号中的话音活动的方法,其特征在于:所述方法包括以下步骤:
(a)至少基于所述输入音频信号的输入帧而确定所述输入音频信号的噪声特性;
(b)将所接收的所述音频信号的输入帧分成若干个子带;
(c)获取所述输入帧的每一子带的信噪比;
(d)基于每一子带的对应子带的信噪比使用自适应函数来计算子带特定参数,其中,根据所述输入音频信号的所述噪声特性来选择所述自适应函数的至少一个参数;以及
(e)通过添加所述计算出的子带特定参数获取作为VAD参数的经修改的分段信噪比;
(f)比较所获取的VAD参数及阈值,以提供话音活动检测决策。
2.根据权利要求1所述的方法,其特征在于:
所述输入音频信号的所述噪声特性为长期信噪比和/或背景噪声变化。
3.根据权利要求1所述的方法,其特征在于:
其中所述自适应函数为非线性函数。
4.根据权利要求1或3所述的方法,其特征在于:
通过以下步骤来获取所述输入帧的每一子带的所述信噪比:
获取每一子带的信号能量,
估算每一子带的背景噪声能量,以及
根据相应子带的所述信号能量和所述背景噪声能量来计算每一子带的所述信噪比。
5.根据权利要求4所述的方法,其特征在于:
其中所述输入帧的每一子带的所述信号能量为平滑信号能量,所述平滑信号能量形成所述输入帧与至少一个先前帧之间的加权平均值。
6.根据权利要求1所述的方法,其特征在于:
通过添加子带特定参数来计算所述经修改的分段信噪比具体如下:
其中N为所述输入帧被分成的子频带的数目,
其中sbsp(i)为基于相应子带的所述信噪比而使用自适应函数计算出的子带特定参数。
7.根据权利要求6所述的方法,其特征在于:
通过如下所示的方式来计算所述经修改的分段信噪比:
其中snr(i)为所述输入帧的第i个子带的信噪比,
N为所述输入帧被分成的子频带的所述数目,
(f(snr(i))+α)β为用以计算所述子带特定参数的所述自适应函数,且
α、β为所述自适应函数的两个可配置变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080030027.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型游戏机鼓的结构
- 下一篇:一种含有改性复配粉体的滤清器用胶片粘合剂