[发明专利]基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法有效

专利信息
申请号: 201310211046.3 申请日: 2013-05-29
公开(公告)号: CN103345920A 公开(公告)日: 2013-10-09
发明(设计)人: 汤一彬;沈媛;朱昌平;周浩;高远;单鸣雷;姚澄 申请(专利权)人: 河海大学常州校区
主分类号: G10L13/02 分类号: G10L13/02;G10L21/047
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 董建林
地址: 213022 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 mel ksvd 稀疏 表示 自适应 内插 加权 模型 语音 转换 方法
【权利要求书】:

1.基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法,其特征在于,利用Mel-KSVD的方法对经过STRAIGHT分析模型提取的平滑功率谱参数进行稀疏表示,包含以下步骤:

(1)输入待合成语音信号,将语音信号通过STRAIGHT分析模型提取平滑谱:首先采用时频补偿法提取功率谱,接着再对功率谱进行低频带补偿和过平滑补偿,最后对功率谱无音帧进行处理,以得到平滑功率谱,平滑功率谱的参数构成一数据矩阵,设为Y=[y1,...,yM];

(2)提取出的平滑功率谱参数通过美尔滤波器后进行字典的训练,再利用Mel-KSVD算法对式:约束条件为进行参数D和X的优化求解,

其中M为美尔滤波器组的系数矩阵,Y=[y1,...,yM]表示功率谱参数矩阵,D=[d1,...,dK]为目标训练字典,di表示字典的一个原子,xk为yk在D上投影的稀疏矢量,X=[x1,...,xM],ε为重构误差门限,||·||F为Frobenius范数,||·||0为0范数;

(3)利用优化出的目标训练字典和通过美尔滤波器和Mel-KSVD算法对STRAIGHT分析模型得到的待合成语音的平滑谱参数进行稀疏表示得到的稀疏矢量xk,并将得到的稀疏系数矩阵X=[x1,...,xM]通过STRAIGHT合成模型进行语音的合成;通过对功率谱参数矩阵进行估计来进行语音的合成,估计矩阵为求解公式为y^k=D~xk,k=1,2,...,M.]]>

2.根据权利要求1所述的基于Mel-KSVD稀疏表示的自适应内插加权谱模型的语音转换及重构方法,其特征在于:步骤(2)所述的算法对式minD,X(||M(Y-DX)||F2+λΣi=1M||xi||0),]]>约束条件为||M(Y-DX)||F2ϵ,]]>进行D和X的优化求解,按如下步骤进行:

(2a)在字典训练阶段,目标字典D与重构误差相关;

在目标函数中的MD被看成一个复杂的字典Deq,字典Deq中的原子dk的优化问题归为如下公式:

<deq,k,δk>=argmindk,xk||Eeq,k-deq,kδk||F2,]]>

其中deq,k是Deq的第k列,δk是X的第k行;

(2b)采用奇异值分解算法对上式处理,得

Eeq,k=UΣVT

d~eq,k=U(:,1),]]>

δ~k=Σ(1,1)*V(:,1),]]>

其中,U和V是酉矩阵,Σ是对角阵,其第k个对角元素为Ek的奇异值,U(:,1)和V(:,1)分别表示U和V的第一列,Σ(1,1)是Σ最大的奇异值;

得到最佳的字典原子优化为

当对于所有k=1,2,...,M,进行稀疏系数和字典更新的迭代,直到时,停止对D的优化求解,此时得到的字典为最佳字典输出稀疏系数矩阵X=[x1,...,xM]和对应字典进入所述的步骤(3),否则重复步骤(2a)与(2b)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310211046.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top