[发明专利]基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法有效
申请号: | 201310211046.3 | 申请日: | 2013-05-29 |
公开(公告)号: | CN103345920A | 公开(公告)日: | 2013-10-09 |
发明(设计)人: | 汤一彬;沈媛;朱昌平;周浩;高远;单鸣雷;姚澄 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L21/047 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 mel ksvd 稀疏 表示 自适应 内插 加权 模型 语音 转换 方法 | ||
1.基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法,其特征在于,利用Mel-KSVD的方法对经过STRAIGHT分析模型提取的平滑功率谱参数进行稀疏表示,包含以下步骤:
(1)输入待合成语音信号,将语音信号通过STRAIGHT分析模型提取平滑谱:首先采用时频补偿法提取功率谱,接着再对功率谱进行低频带补偿和过平滑补偿,最后对功率谱无音帧进行处理,以得到平滑功率谱,平滑功率谱的参数构成一数据矩阵,设为Y=[y1,...,yM];
(2)提取出的平滑功率谱参数通过美尔滤波器后进行字典的训练,再利用Mel-KSVD算法对式:约束条件为进行参数D和X的优化求解,
其中M为美尔滤波器组的系数矩阵,Y=[y1,...,yM]表示功率谱参数矩阵,D=[d1,...,dK]为目标训练字典,di表示字典的一个原子,xk为yk在D上投影的稀疏矢量,X=[x1,...,xM],ε为重构误差门限,||·||F为Frobenius范数,||·||0为0范数;
(3)利用优化出的目标训练字典和通过美尔滤波器和Mel-KSVD算法对STRAIGHT分析模型得到的待合成语音的平滑谱参数进行稀疏表示得到的稀疏矢量xk,并将得到的稀疏系数矩阵X=[x1,...,xM]通过STRAIGHT合成模型进行语音的合成;通过对功率谱参数矩阵进行估计来进行语音的合成,估计矩阵为求解公式为
2.根据权利要求1所述的基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法,其特征在于:步骤(2)所述的算法对式
(2a)在字典训练阶段,目标字典D与重构误差相关;
在目标函数中的MD被看成一个复杂的字典Deq,字典Deq中的原子dk的优化问题归为如下公式:
其中deq,k是Deq的第k列,δk是X的第k行;
(2b)采用奇异值分解算法对上式处理,得
Eeq,k=UΣVT,
其中,U和V是酉矩阵,Σ是对角阵,其第k个对角元素为Ek的奇异值,U(:,1)和V(:,1)分别表示U和V的第一列,Σ(1,1)是Σ最大的奇异值;
得到最佳的字典原子优化为
当对于所有k=1,2,...,M,进行稀疏系数和字典更新的迭代,直到时,停止对D的优化求解,此时得到的字典为最佳字典输出稀疏系数矩阵X=[x1,...,xM]和对应字典进入所述的步骤(3),否则重复步骤(2a)与(2b)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310211046.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光纤平衡干涉高速测振系统
- 下一篇:一种中型工字钢梁耐火极限测试装置