[发明专利]语音分析方法和装置以及语音合成方法和装置有效

申请号：	200710092294.5	申请日：	2007-04-04
公开（公告）号：	CN101281744A	公开（公告）日：	2008-10-08
发明（设计）人：	孟繁平;双志伟;蒋丹宁;秦勇	申请（专利权）人：	国际商业机器公司
主分类号：	G10L13/02	分类号：	G10L13/02
代理公司：	北京市中咨律师事务所	代理人：	于静;张亚非
地址：	美国***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音分析方法装置以及合成
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1. 一种语音分析方法，包括以下步骤：

获取语音信号和相应的DEGG/EGG信号；

将所述语音信号视为声源-滤波器模型中以所述DEGG/EGG信号为输入的声道滤波器的输出；以及

由作为输出的所述语音信号和作为输入的所述DEGG/EGG信号估计所述声道滤波器的特征。

2. 根据权利要求1的语音分析方法，其中所述声道滤波器特征由所述声道滤波器在选定时间点的状态向量表示，且所述估计步骤是使用卡尔曼滤波完成的。

3. 根据权利要求2的语音分析方法，其中所述卡尔曼滤波基于：

状态方程

x_k＝x_k-1+d_k，和

观测方程

v_k＝e_k^Tx_k+n_k，

其中，x_k＝[x_k(0)，x_k(1)，...，x_k(N-1)]^T表示待估计的、声道滤波器在k时间点上的状态向量，其中x_k(0)，x_k(1)，...，x_k(N-1)表示所述声道滤波器在时间点k的预期单位冲激响应的N个样本；

d_k＝[d_k(0)，d_k(1)，...，d_k(N-1)]^T表示在时间点k添加到状态向量的扰动；

e_k＝[e_k，e_k-1，...，e_k-N+1]^T是一向量，其中元素e_k表示在时间点k输入的DEGG信号；

v_k表示在时间点k输出的语音信号；以及

n_k表示在时间点k添加到所述输出的语音信号的观测噪声。

4. 根据权利要求3的语音分析方法，其中所述卡尔曼滤波为包括前向滤波和后向滤波的双向卡尔曼滤波，其中，

所述前向卡尔曼滤波包括以下步骤：

前向预估：

x_k~＝x_k-1^＊，

P_k~＝P_k-1+Q

修正：

K_k＝P_k~e_k[e_k^TP_k~e_k+r]^-1

x_k^＊＝x_k~+K_k[v_k-e_k^Tx_k~]

P_k＝[I-K_ke_k^T]P_k~

前向递归

k＝k+1；

所述后向卡尔曼滤波包括以下步骤：

后向预估：

x_k~＝x_k+1^＊，

P_k~＝P_k+1+Q

修正：

K_k＝P_k~e_k[e_k^TP_k~e_k+r]^-1

x_k^＊＝x_k~+K_k[v_k-e_k^Tx_k~]

P_k＝[I-K_ke_k^T]P_k~

后向递归

k＝k-1；

其中，x_k~表示时间点k的状态预估值，x_k^＊表示时间点k的状态修正值，P_k~表示估计误差的协方差矩阵的预估值，P_k表示估计误差的协方差矩阵的修正值，Q表示扰动d_k的协方差矩阵，K_k表示卡尔曼增益，r表示观测噪声n_k的方差，I表示单位矩阵；并且

所述双向卡尔曼滤波的估计结果为所述前向卡尔曼滤波的估计结果与所述后向卡尔曼滤波的估计结果按以下公式的结合：

P_k＝(P_k+^-1+P_k-^-1)^-1，

x_k^＊＝P_k(P_k+^-1x_k+^＊+P_k-^-1x_k-^＊)，

其中P_k+、x_k+分别为由前向卡尔曼滤波所得的声道滤波器的状态估计值和该估计的协方差，P_k-、x_k-分别为由后向卡尔曼滤波所得的声道滤波器的状态估计值和状态估计的协方差。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国际商业机器公司，未经国际商业机器公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200710092294.5/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L13-00 语音合成；文本-语音合成系统
G10L13-02 .产生合成语音的方法；语音合成设备
G10L13-06 .语音合成设备中使用的基本语音单位；级联规则
G10L13-08 .文本分析或文本以外的语音合成参数的产生，例如语义图翻译为音素、韵律产生、重音或声调测定
G10L13-04 ..语音合成系统的零部件，例如合成设备结构或存储器管理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音分析方法和装置以及语音合成方法和装置有效

专利文献下载