[发明专利]噪声抑制、提取语音特征、语音识别及训练语音模型的方法和装置有效
申请号: | 200610141240.9 | 申请日: | 2006-09-29 |
公开(公告)号: | CN101154383A | 公开(公告)日: | 2008-04-02 |
发明(设计)人: | 丁沛;何磊;鄢翔;赵蕤;郝杰 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L15/20;G10L15/02;G10L15/08;G10L15/06;G10L15/00 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 李峥;刘瑞东 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 噪声 抑制 提取 语音 特征 识别 训练 模型 方法 装置 | ||
1.一种用于含噪声语音谱的噪声抑制方法,包括:
根据噪声估计谱,对所述含噪声语音谱进行对数谱最小均方误差估计,以降低所述含噪声语音谱的噪声;
其中,用分段线性函数代替增益函数来进行所述对数谱最小均方误差估计。
2.根据权利要求1所述的噪声抑制方法,其中,利用预先设定的分割点将所述增益函数变换为所述分段线性函数,进行所述对数谱最小均方误差估计。
3.根据权利要求2所述的噪声抑制方法,其中,所述分段线性函数的所述预先设定的分割点通过以下步骤获得:
计算所述增益函数的导数;
设定所述分段线性函数的初始分割点;
计算在所述初始分割点的每两个连续分割点之间的所述分段线性函数和所述增益函数之间的差别;
如果所述差别大于一阈值,在所述两个连续分割点之间插入一个新的分割点;以及
重复所述计算差别的步骤及其之后的步骤,直到没有所述差别大于所述阈值。
4.根据权利要求1-3中的任意一项所述的噪声抑制方法,其中,所述对数谱最小均方误差估计通过以下公式进行:
其中
其中表示噪声得到抑制的语音谱,Rk表示含噪声语音谱,ξk是根据噪声估计谱获得的先验信噪比,γk是根据噪声估计谱和含噪声语音谱获得的后验信噪比,L(υk)是分段线性函数,以及k表示第k个谱分量。
5.一种用于含噪声语音谱的噪声抑制方法,包括:
根据噪声估计谱,对所述含噪声语音谱进行对数谱最小均方误差估计,以降低所述含噪声语音谱的噪声;
其中,通过以下步骤计算增益函数来进行所述对数谱最小均方误差估计:
利用泰勒级数累加计算所述增益函数;
利用数值积分计算所述增益函数;以及
合并所述泰勒级数累加的结果和所述数值积分的结果。
6.根据权利要求5所述的噪声抑制方法,其中,所述合并步骤包括:将所述泰勒级数累加的结果和所述数值积分的结果在它们之间的最接近处合并。
7.根据权利要求6所述的噪声抑制方法,其中,所述合并步骤包括:
将所述泰勒级数累加的结果和所述数值积分的结果相减;
选择上述相减的结果中绝对值最小处的值作为阈值;以及
根据所述阈值,合并所述泰勒级数累加的结果和所述数值积分的结果。
8.根据权利要求7所述的噪声抑制方法,其中,所述合并步骤包括将小于所述阈值的所述泰勒级数累加的结果和大于所述阈值的所述数值积分的结果合并。
9.一种用于提取语音特征的方法,包括:
将含噪声语音变换成含噪声语音谱;
利用上述权利要求1-8中的任意一项所述的噪声抑制方法,降低所述含噪声语音谱的噪音;以及
从所述噪声降低的语音谱提取语音特征。
10.根据权利要求9所述的提取语音特征的方法,其中,所述变换步骤包括快速傅立叶变换。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610141240.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:不锈钢板整体燃烧器
- 下一篇:终端签约能力信息获取系统及方法