[发明专利]基于谐波模型和声源-声道特征分解的语音分析合成方法有效
申请号: | 201580080885.3 | 申请日: | 2015-12-10 |
公开(公告)号: | CN107851433B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 华侃如 | 申请(专利权)人: | 华侃如 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L25/48;G10L25/75;G10L13/04 |
代理公司: | 北京大成律师事务所 11352 | 代理人: | 李佳铭;沈汶波 |
地址: | 201203 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 谐波 模型 声源 声道 特征 分解 语音 分析 合成 方法 | ||
1.一种基于谐波模型(Harmonic Model)的语音分析方法,其特征在于对谐波模型的参数进行声源和声道特征分解,其中声源特征包括声源模型参数和各对应到各谐波的相位差,该分析方法具体包括以下步骤:
a)对输入语音信号进行谐波分析,获得各分析时刻的基频、谐波幅度向量和谐波相位向量;
b)预测输入语音信号在各分析时刻的声源特征,获得声源模型的参数,根据声源模型的参数计算声源模型的频率响应,包括声源模型的幅度响应和声源模型的相位响应;
c)获得声道的幅度响应;将谐波幅度向量除以声源的幅度响应,获得声道的幅度响应;
d)根据声道的幅度响应,计算声道的相位响应,具体方法包括基于最小相位假设,使用同态滤波方法获得相位响应;
e)获得声源的频率响应,包括声源相位向量,具体方法为:将谐波相位向量与声道的相位响应相减获得声源相位向量;
f)计算步骤e中获得的对应到各谐波的声源的相位向量和步骤b中获得的声源模型的相位响应之差,获得对应到各谐波的相位差向量。
2.一种基于谐波模型的语音分析方法,其特征在于,对谐波模型的参数进行声源和声道特征分解,其中声源特征包括各对应到各谐波的幅度向量和相位向量,该分析方法具体包括以下步骤:
a)对输入语音信号进行谐波分析,获得各分析时刻的基频、谐波幅度向量和谐波相位向量;
b)可选地,预测输入语音信号在各分析时刻的声源特征,计算声源的幅度响应;
c)获得声道的幅度响应,具体包含如下步骤:若声源的幅度响应为未知,则将声道的幅度响应定义为谐波幅度向量;若声源的幅度响应为已知,则将谐波幅度向量除以声源的幅度响应,获得声道的幅度响应;
d)根据声道的幅度响应,计算声道的相位响应,具体方法包括基于最小相位假设,使用同态滤波方法获得相位响应;
e)获得声源的频率响应,包括声源相位向量,具体方法为:将谐波相位向量与声道的相位响应相减获得声源相位向量。
3.一种基于谐波模型的语音合成方法,其特征在于对分解后和的声源和声道特征进行重新组合,并将其转化成适用于谐波模型的参数,其中声源特征包括声源模型参数和对应到各谐波的声源相位差向量,声道特征包括声道的幅度响应,该合成方法具体包括以下步骤:
a)根据声道的幅度响应,计算声道的相位响应,具体方法包括基于最小相位假设,使用同态滤波方法获得相位响应;
b)根据声源模型的参数计算声源模型的频率响应,包括声源模型的幅度响应和声源模型的相位响应;
c)将声源模型的相位响应和对应到各谐波的声源相位差向量相加,获得对应到各谐波的声源相位向量;
d)将各谐波频率上的声道的幅度响应和声源幅度响应相乘,获得各谐波的幅度;将各谐波频率上的声道的相位响应和对应到各谐波的声源相位向量相加,获得各谐波的相位;
e)根据基频以及各谐波的幅度和相位,合成语音信号。
4.一种基于谐波模型的语音合成方法,其特征在于对分解后和的声源和声道特征进行重新组合,并将其转化成适用于谐波模型的参数,其中声源特征包括对应到各谐波的声源幅度向量和声源相位向量,声道特征包括声道的幅度响应,该合成方法具体包括以下步骤:
a)根据声道的幅度响应,计算声道的相位响应,具体方法包括基于最小相位假设,使用同态滤波方法获得相位响应;
b)将各谐波频率上的声道的幅度响应和对应到各谐波的声源幅度向量相乘,获得各谐波的幅度;将各谐波频率上的声道的相位响应和对应到各谐波的声源相位向量相加,获得各谐波的相位;
c)根据基频以及各谐波的幅度和相位,合成语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侃如,未经华侃如许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580080885.3/1.html,转载请声明来源钻瓜专利网。