[发明专利]噪声稳健语音译码模式分类有效
申请号: | 201280025143.7 | 申请日: | 2012-04-12 |
公开(公告)号: | CN103548081A | 公开(公告)日: | 2014-01-29 |
发明(设计)人: | 伊桑·罗伯特·杜尼;维韦克·拉金德朗 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G10L25/93 | 分类号: | G10L25/93;G10L25/78;G10L19/22;G10L19/025 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 宋献涛 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪声 稳健 语音 译码 模式 分类 | ||
1.一种噪声稳健语音分类的方法,其包括:
将分类参数从外部组件输入到语音分类器;
在所述语音分类器中从所述输入参数中的至少一者产生内部分类参数;
设定正规化自动相关系数函数阈值且根据信号环境来选择参数分析器;及
基于多个输入语音帧的噪声估计而确定语音模式分类。
2.根据权利要求1所述的方法,其中所述设定包括在所述噪声估计超过噪声估计阈值时减低用于将当前帧分类为浊音的发声阈值,其中如果所述噪声估计低于所述噪声估计阈值,则不调整所述发声阈值。
3.根据权利要求1所述的方法,其中所述设定包括:
当所述噪声估计超过噪声估计阈值时增大用于将当前帧分类为清音的发声阈值;及
当所述噪声估计超过噪声估计阈值时增大用于将所述当前帧分类为清音的能量阈值,其中如果所述噪声估计低于所述噪声估计阈值,则不调整所述发声阈值及所述能量阈值。
4.根据权利要求1所述的方法,其中所述输入参数包括经噪声抑制语音信号。
5.根据权利要求1所述的方法,其中所述输入参数包括话音活动信息。
6.根据权利要求1所述的方法,其中所述输入参数包括线性预测反射系数。
7.根据权利要求1所述的方法,其中所述输入参数包括正规化自动相关系数函数信息。
8.根据权利要求1所述的方法,其中所述输入参数包括音高处正规化自动相关系数函数信息。
9.根据权利要求8所述的方法,其中所述音高处正规化自动相关系数函数信息为值阵列。
10.根据权利要求1所述的方法,其中所述内部参数包括过零率参数。
11.根据权利要求1所述的方法,其中所述内部参数包括当前帧能量参数。
12.根据权利要求1所述的方法,其中所述内部参数包括先行帧能量参数。
13.根据权利要求1所述的方法,其中所述内部参数包括频带能量比率参数。
14.根据权利要求1所述的方法,其中所述内部参数包括三帧平均浊音能量参数。
15.根据权利要求1所述的方法,其中所述内部参数包括先前三帧平均浊音能量参数。
16.根据权利要求1所述的方法,其中所述内部参数包括当前帧能量对先前三帧平均浊音能量比率参数。
17.根据权利要求1所述的方法,其中所述内部参数包括当前帧能量对三帧平均浊音能量参数。
18.根据权利要求1所述的方法,其中所述内部参数包括最大子帧能量索引参数。
19.根据权利要求1所述的方法,其中所述设定正规化自动相关系数函数阈值包括比较对预定信号的所述噪声估计与噪声估计阈值。
20.根据权利要求1所述的方法,其中所述参数分析器将所述参数应用于状态机。
21.根据权利要求20所述的方法,其中所述状态机针对每一语音分类模式包括一状态。
22.根据权利要求1所述的方法,其中所述语音模式分类包括暂态模式。
23.根据权利要求1所述的方法,其中所述语音模式分类包括上行暂态模式。
24.根据权利要求1所述的方法,其中所述语音模式分类包括下行暂态模式。
25.根据权利要求1所述的方法,其中所述语音模式分类包括浊音模式。
26.根据权利要求1所述的方法,其中所述语音模式分类包括清音模式。
27.根据权利要求1所述的方法,其中所述语音模式分类包括静音模式。
28.根据权利要求1所述的方法,其进一步包括更新至少一个参数。
29.根据权利要求28所述的方法,其中所述经更新参数包括音高处正规化自动相关系数函数参数。
30.根据权利要求28所述的方法,其中所述经更新参数包括三帧平均浊音能量参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280025143.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多位存储器单元的条件编程
- 下一篇:多晶硅铸锭炉