[发明专利]一种基于谐波冲激分解的语音转换方法有效

申请号：	201810335633.6	申请日：	2018-04-16
公开（公告）号：	CN108766450B	公开（公告）日：	2023-02-17
发明（设计）人：	简志华;张石磊;郭珊;徐剑	申请（专利权）人：	杭州电子科技大学
主分类号：	G10L19/02	分类号：	G10L19/02;G10L15/06;G10L13/02
代理公司：	浙江千克知识产权代理有限公司 33246	代理人：	周希良
地址：	310018 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于谐波冲激分解语音转换方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于谐波冲激分解的语音转换方法，其特征在于，包括如下步骤：

S1，将语音信号分解成谐波信号和冲激信号；

S2，将所述谐波信号进行语音转换，形成目标谐波信号；

S3，将所述目标谐波信号与所述冲激信号进行叠加，形成目标语音信号；

步骤S1中，将语音信号分解成谐波信号和冲激信号的具体步骤如下：

S11，采用STRAIGHT模型对所述语音信号进行建模，得到该语音信号的频谱矢量序列X，X表示成语音信号的语谱图；

S12，计算水平方向的幅度谱和垂直方向的幅度谱分别为：

其中m表示语谱图的时间点，k表示语谱图的频点；w_h用来描述水平方向中值滤波器的长度；w_p用来描述垂直方向中值滤波器的长度；median(·)表示中值滤波函数；

S13，对语音信号的语谱图X进行标记，得到谐波信号的标记矩阵M_h和冲激信号的标记矩阵M_p，即：

S14，计算所述语音信号的谐波信号频谱X_h(m，k)和冲激信号频谱X_p(m，k)，即：

X_h(m，k)＝X(m，k)·M_h(m，k)

X_p(m，k)＝X(m，k)·M_p(m，k)。

2.根据权利要求1所述的方法，其特征在于：所述方法包括训练阶段和转换阶段，在所述训练阶段，所述语音信号包括源语音信号和样本语音信号，步骤S1中，对所述源语音信号和样本语音信号进行激光冲激分解，同时提取梅尔频率倒谱系数MFCC，用MFCC根据动态时间规整算法对源语音信号和样本语音信号在时间上进行规整并保留时间对齐信息；

在所述转换阶段，所述语音信号为源语音信号，步骤S1中，对所述源语音信号进行激光冲激分解。

3.根据权利要求2所述的方法，其特征在于：

步骤S2中，将谐波信号进行语音转换形成目标谐波信号，是指对所述谐波信号频谱进行转换形成目标谐波信号频谱，具体为：

S21，根据所述时间对齐信息，随机抽取源语音信号和样本语音信号相同位置的谐波信号频谱构造平行的源语音字典A和样本语音字典B，并存储，之后结束所述训练阶段；

S22，在所述转换阶段，对源语音信号的谐波信号频谱X_h(m，k)进行稀疏表示；即

X_h(m，k)＝AH

激励矩阵H∈R^N×M，其中，N表示基矢量的个数，M表示语音信号的帧数，激励矩阵H由激励矢量h迭代求解，

其中，A是源语音字典，x∈R^K×1表示一帧语音信号的幅度谱，K表示一帧幅度谱的维数，I表示K维的数值全为1的矢量，λ表示K维的惩罚因子矢量，T表示矩阵转置运算符，.×表示矩阵对应点之间相乘运算符；

S23，在所述转换阶段，利用源语音信号的激励矩阵H和样本语音信号的谐波信号样本字典B对源语音的谐波信号频谱进行转换，转换后的目标谐波信号频谱表示为

4.根据权利要求3所述的方法，其特征在于：

步骤S3中，将所述目标谐波信号与所述冲激信号进行叠加，形成目标语音信号的具体步骤为：将转换后的目标谐波信号频谱和未经过处理的源语音冲激信号部分进行叠加，得到转换后的目标语音频谱。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。