[发明专利]基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法有效
申请号: | 201310211046.3 | 申请日: | 2013-05-29 |
公开(公告)号: | CN103345920A | 公开(公告)日: | 2013-10-09 |
发明(设计)人: | 汤一彬;沈媛;朱昌平;周浩;高远;单鸣雷;姚澄 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L21/047 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 mel ksvd 稀疏 表示 自适应 内插 加权 模型 语音 转换 方法 | ||
技术领域
本发明属于语音信号处理领域,涉及一种语音转换和重构模型,特别涉及一种基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法。
背景技术
语音参数化和重构是一个重要且具有一定挑战性的问题,其对应的语音分析-合成系统被广泛用于各种领域,如语音编码、转换等。
在H.Kawahara等人在1999年4月发表的“基于自适应内插加权谱模型的语音转换及重构方法”文献中表明,基于自适应内插加权谱的语音转换及重构模型,抛弃了传统语音模型中声门、声道的构造,直接提取语音的功率谱,获得了高质量的语音合成效果。其逐渐成为目前主流的语音分析合成模型,广泛应用在语音合成、语音转换等各方面。其采用以VOCODER为原型的源滤波器的思想来表征语音信号,把语音信号看作激励信号通过时变线性滤波器后输出的结果。在分析得到各帧的语音功率谱后,对该功率谱进行时频域上的平滑处理,同时在时间轴和频率轴上进行过采样,保证合成阶段对语音的高质量重构。
近几年来,稀疏表示理论得到了很快的发展,并应用于诸多领域,如:图像降噪、盲源分离、语音增强等。上述的应用都是为了获得稀 疏域的相关稀疏系数,来表征语音信号的内在特征。STRAIGHT模型本身也存在一些缺陷。经过STRAIGHT模型提取出的平滑功率谱包络参数具有相当的冗余信息,该模型值得更进一步的完善。但是,学者们很少关注STRAIGHT模型的改进,因此,如何将STRAIGHT模型与稀疏表示理论相结合,进一步压缩模型参数,成为制约该模型进一步应用和发展的一个重要问题。
发明内容
本发明的目的在于克服上述问题,提供一种基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法,实现在保持合成语音质量基本不变的同时,将STRAIGHT模型与稀疏表示理论相结合,使模型输出参数得到进一步的压缩,减少参数的传递的个数,减小STRAIGHT模型计算量,从而提高语音的合成质量。
本发明的技术方案从以下方面考虑:STRAIGHT模型是一种基于功率谱的语音模型。其平滑功率谱参数为一种经过时频域补偿后的功率谱,具有一定的冗余信息。因此可通过Mel-KSVD的方法压缩模型的输出参数,对其进行稀疏表示,根据得到的稀疏系数合成语音并最终达到减少参数的传递的个数,减小STRAIGHT模型计算量的目的。
本发明的技术方案如下:
基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法,其特征在于,利用Mel-KSVD的方法对经过STRAIGHT分析模型提取的平滑功率谱参数进行稀疏表示,包含以下步骤:
(1)输入待合成语音信号,将语音信号通过STRAIGHT分析模型 提取平滑谱:首先采用时频补偿法提取功率谱,接着再对功率谱进行低频带补偿和过平滑补偿,最后对功率谱的无音帧进行处理,以得到平滑功率谱,平滑功率谱的参数构成一数据矩阵,设为Y=[y1,...,yM];
(2)提取出的平滑功率谱参数通过美尔滤波器后进行字典的训练,再利用Mel-KSVD算法对式:约束条件为 进行参数D和X的优化求解,
其中M为美尔滤波器组的系数矩阵,Y=[y1,...,yM]表示功率谱参数矩阵,D=[d1,...,dK]为目标训练字典,di表示字典的一个原子,xk为yk在D上投影的稀疏矢量,X=[x1,...,xM],||·||F为Frobenius范数,||·||0为0范数;
(3)利用优化出的目标训练字典和通过美尔滤波器和Mel-KSVD算法对STRAIGHT分析模型得到的待合成语音的平滑谱参数进行稀疏表示得到的稀疏矢量xk,并将得到的稀疏系数矩阵X=[x1,...,xM]通过STRAIGHT合成模型进行语音的合成;通过对功率谱参数矩阵进行估计来进行语音的合成,估计矩阵为求解公式为k=1,2,...,M。
进一步的技术方案包括:
步骤(2)所述的算法对式约束条件为 进行D和X的优化求解,按如下步骤进行:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310211046.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光纤平衡干涉高速测振系统
- 下一篇:一种中型工字钢梁耐火极限测试装置