[发明专利]语音分析方法和装置以及语音合成方法和装置有效
申请号: | 200710092294.5 | 申请日: | 2007-04-04 |
公开(公告)号: | CN101281744A | 公开(公告)日: | 2008-10-08 |
发明(设计)人: | 孟繁平;双志伟;蒋丹宁;秦勇 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 于静;张亚非 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 分析 方法 装置 以及 合成 | ||
1. 一种语音分析方法,包括以下步骤:
获取语音信号和相应的DEGG/EGG信号;
将所述语音信号视为声源-滤波器模型中以所述DEGG/EGG信号为输入的声道滤波器的输出;以及
由作为输出的所述语音信号和作为输入的所述DEGG/EGG信号估计所述声道滤波器的特征。
2. 根据权利要求1的语音分析方法,其中所述声道滤波器特征由所述声道滤波器在选定时间点的状态向量表示,且所述估计步骤是使用卡尔曼滤波完成的。
3. 根据权利要求2的语音分析方法,其中所述卡尔曼滤波基于:
状态方程
xk=xk-1+dk,和
观测方程
vk=ekTxk+nk,
其中,xk=[xk(0),xk(1),...,xk(N-1)]T表示待估计的、声道滤波器在k时间点上的状态向量,其中xk(0),xk(1),...,xk(N-1)表示所述声道滤波器在时间点k的预期单位冲激响应的N个样本;
dk=[dk(0),dk(1),...,dk(N-1)]T表示在时间点k添加到状态向量的扰动;
ek=[ek,ek-1,...,ek-N+1]T是一向量,其中元素ek表示在时间点k输入的DEGG信号;
vk表示在时间点k输出的语音信号;以及
nk表示在时间点k添加到所述输出的语音信号的观测噪声。
4. 根据权利要求3的语音分析方法,其中所述卡尔曼滤波为包括前向滤波和后向滤波的双向卡尔曼滤波,其中,
所述前向卡尔曼滤波包括以下步骤:
前向预估:
xk~=xk-1*,
Pk~=Pk-1+Q
修正:
Kk=Pk~ek[ekTPk~ek+r]-1
xk*=xk~+Kk[vk-ekTxk~]
Pk=[I-KkekT]Pk~
前向递归
k=k+1;
所述后向卡尔曼滤波包括以下步骤:
后向预估:
xk~=xk+1*,
Pk~=Pk+1+Q
修正:
Kk=Pk~ek[ekTPk~ek+r]-1
xk*=xk~+Kk[vk-ekTxk~]
Pk=[I-KkekT]Pk~
后向递归
k=k-1;
其中,xk~表示时间点k的状态预估值,xk*表示时间点k的状态修正值,Pk~表示估计误差的协方差矩阵的预估值,Pk表示估计误差的协方差矩阵的修正值,Q表示扰动dk的协方差矩阵,Kk表示卡尔曼增益,r表示观测噪声nk的方差,I表示单位矩阵;并且
所述双向卡尔曼滤波的估计结果为所述前向卡尔曼滤波的估计结果与所述后向卡尔曼滤波的估计结果按以下公式的结合:
Pk=(Pk+-1+Pk--1)-1,
xk*=Pk(Pk+-1xk+*+Pk--1xk-*),
其中Pk+、xk+分别为由前向卡尔曼滤波所得的声道滤波器的状态估计值和该估计的协方差,Pk-、xk-分别为由后向卡尔曼滤波所得的声道滤波器的状态估计值和状态估计的协方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710092294.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高强度螺纹钢筋及其制备工艺
- 下一篇:与非闪存器及其管理方法