[发明专利]一种基于谐波冲激分解的语音转换方法有效
申请号: | 201810335633.6 | 申请日: | 2018-04-16 |
公开(公告)号: | CN108766450B | 公开(公告)日: | 2023-02-17 |
发明(设计)人: | 简志华;张石磊;郭珊;徐剑 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L15/06;G10L13/02 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 谐波 冲激 分解 语音 转换 方法 | ||
本发明提出一种基于谐波冲激分解的语音转换方法,包括如下步骤:S1,将语音信号分解成谐波信号和冲激信号;S2,将所述谐波信号进行语音转换,形成目标谐波信号;S3,将所述目标谐波信号与所述冲激信号进行叠加,形成目标语音信号。本发明采用谐波冲激分解模型对语音信号进行分解,将语音信号分解成谐波信号部分和冲激信号部分,仅对谐波信号部分做频谱分解和稀疏表示,不对冲激信号做任何处理,既能够保证信息的完全性、又可以减少信息的丢失,还有利于提高转换后语音的质量,处理过程简单、方便,推广性强,具有较高的应用前景。
技术领域
本发明属于语音转换技术领域,具体涉及一种基于谐波冲激分解的语音转换方法。
背景技术
说话人身份特征是语音信号中所包含的一种非常重要的特征信息。语音转换的处理对象就是语音信号中的身份特征信息,它的目的就是要改变源语音中的身份特征,使得转换后的语音听起来就像是特定的目标说话人的声音一样。语音转换技术具有广泛的应用前景,特别是应用于个性化的语音合成领域。
发明内容
本发明提出一种基于谐波冲激分解的语音转换方法,以提高语音转换后的语音质量,简化语音转换处理过程。
为实现本发明的目的,本发明采用以下技术方案:
一种基于谐波冲激分解的语音转换方法,包括如下步骤:
S1,将语音信号分解成谐波信号和冲激信号;
S2,将所述谐波信号进行语音转换,形成目标谐波信号;
S3,将所述目标谐波信号与所述冲激信号进行叠加,形成目标语音信号。
进一步地,步骤S1中,将语音信号分解成谐波信号和冲激信号的具体步骤如下:
S11,采用STRAIGHT模型对所述语音信号进行建模,得到该语音信号的频谱矢量序列
X,X表示成语音信号的语谱图;
S12,计算水平方向的幅度谱和垂直方向的幅度谱分别为:
其中m表示语谱图的时间点,k表示语谱图的频点;wh用来描述水平方向中值滤波器的长度;wp用来描述垂直方向中值滤波器的长度;median(·)表示中值滤波函数。
S13,对语音信号的语谱图X进行标记,得到谐波信号的标记矩阵Mh和冲激信号的标记矩阵Mp,即:
S14,计算所述语音信号的谐波信号频谱Xh(m,k)和冲激信号频谱Xp(m,k),即:
Xh(m,k)=X(m,k)·Mh(m,k)
Xp(m,k)=X(m,k)·Mp(m,k)
进一步地,所述方法整体包括训练阶段和转换阶段,
在所述训练阶段,所述语音信号包括源语音信号和样本语音信号,所述步骤S1中,对所述源语音信号和样本语音信号进行激光冲激分解,同时提取梅尔频率倒谱系数MFCC,用MFCC根据动态时间规整算法对源语音信号和样本语音信号在时间上进行规整并保留时间对齐信息;
在所述转换阶段,所述语音信号为源语音信号,所述步骤S1中,对所述源语音信号进行激光冲激分解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810335633.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频信号的可逆水印实现方法
- 下一篇:修音方法及装置