[发明专利]基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法有效
申请号: | 201310211046.3 | 申请日: | 2013-05-29 |
公开(公告)号: | CN103345920A | 公开(公告)日: | 2013-10-09 |
发明(设计)人: | 汤一彬;沈媛;朱昌平;周浩;高远;单鸣雷;姚澄 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L21/047 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于语音信号处理领域,公开了一种基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法,该方法充分考虑了模型参数的数据压缩问题,在语音分析阶段提取出平滑功率谱之后,利用Mel-KSVD的方法对提取的平滑功率谱参数进行相关稀疏系数的表示,同时,在稀疏表示时通过字典自适应学习的策略不断更新字典,最优化稀疏系数。仿真结果表明,该模型与传统的稀疏系数较少的模型相比,其合成语音质量总体相当或者更好,在男声语音方面甚至更优于传统KSVD稀疏表示的模型。此外,该方法比美尔倒谱系数压缩模型相比,语音合成质量更好。 | ||
搜索关键词: | 基于 mel ksvd 稀疏 表示 自适应 内插 加权 模型 语音 转换 方法 | ||
【主权项】:
1.基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法,其特征在于,利用Mel-KSVD的方法对经过STRAIGHT分析模型提取的平滑功率谱参数进行稀疏表示,包含以下步骤:(1)输入待合成语音信号,将语音信号通过STRAIGHT分析模型提取平滑谱:首先采用时频补偿法提取功率谱,接着再对功率谱进行低频带补偿和过平滑补偿,最后对功率谱无音帧进行处理,以得到平滑功率谱,平滑功率谱的参数构成一数据矩阵,设为Y=[y1,...,yM];(2)提取出的平滑功率谱参数通过美尔滤波器后进行字典的训练,再利用Mel-KSVD算法对式:
约束条件为
进行参数D和X的优化求解,其中M为美尔滤波器组的系数矩阵,Y=[y1,...,yM]表示功率谱参数矩阵,D=[d1,...,dK]为目标训练字典,di表示字典的一个原子,xk为yk在D上投影的稀疏矢量,X=[x1,...,xM],ε为重构误差门限,||·||F为Frobenius范数,||·||0为0范数;(3)利用优化出的目标训练字典
和通过美尔滤波器和Mel-KSVD算法对STRAIGHT分析模型得到的待合成语音的平滑谱参数进行稀疏表示得到的稀疏矢量xk,并将得到的稀疏系数矩阵X=[x1,...,xM]通过STRAIGHT合成模型进行语音的合成;通过对功率谱参数矩阵进行估计来进行语音的合成,估计矩阵为
求解公式为y ^ k = D ~ x k , k = 1,2 , . . . , M . ]]>
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310211046.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种光纤平衡干涉高速测振系统
- 下一篇:一种中型工字钢梁耐火极限测试装置