[发明专利]基于支持向量机在语音解码端重构子带清浊音度参数的方法有效

专利信息
申请号: 201810232462.4 申请日: 2018-03-21
公开(公告)号: CN108461088B 公开(公告)日: 2019-11-19
发明(设计)人: 李晔;马晓凤;姜竞赛;郝秋赟;张鹏 申请(专利权)人: 山东省计算中心(国家超级计算济南中心)
主分类号: G10L19/16 分类号: G10L19/16;G10L19/04;G10L25/93;G10L19/08;G10L19/087
代理公司: 暂无信息 代理人: 暂无信息
地址: 250014 山东省济*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明的基于支持向量机在语音解码端重构子带清浊音度参数的方法,首先利用语音样本的5个子带清浊音度参数、声道参数、基音参数和能量参数训练出5个子带清浊音判决的支持向量机模型,在低速率声码器的解码端,利用线谱频率参数、基音周期参数、能量参数与子带清浊音度参数的相关性,对子带清浊音度参数进行重构。摒弃传统编码器中对子带清浊音度参数量化编码传输的方法,在声码器中引入支持向量机,利用线谱频率参数、基音周期参数和能量参数将子带清浊音度参数直接恢复出来,在不明显降低各子带清浊音判决准确率的前提下,节省的量化比特数,可用来量化其他更加重要的参数,整体上可以进一步提升合成语音的质量。
搜索关键词: 浊音度 子带 支持向量机 能量参数 重构 基音周期 线谱频率 语音解码 声码器 支持向量机模型 传统编码器 量化比特数 编码传输 参数量化 基音参数 声道参数 语音样本 解码端 判决 准确率 可用 合成 量化 语音 引入 恢复
【主权项】:
1.一种基于支持向量机在语音解码端重构子带清浊音度参数的方法,包括支持向量机模型训练阶段和子带清浊音度参数恢复阶段;其特征在于:支持向量机模型训练阶段,首先采集足够长的语音信号并对其进行分帧,然后提取分帧的5个子带清浊音度参数、声道参数、基音参数和能量参数,以形成支持向量机模型的训练数据,然后通过迭代的方式训练出5个子带清浊音判决的支持向量机模型;子带清浊音度参数恢复阶段,编码端采集语音信号并分帧,然后提取分帧的声道参数、基音参数和能量参数并对其量化编码和传输,解码端根据接收到的索引值反量化后得到声道参数、基音参数和能量参数,并利用训练好的5个子带清浊音判决的支持向量机模型重构子带清浊音度参数,以形成高质量的语音信号;/n所述支持向量机模型训练阶段通过以下步骤来实现:/na).语音信号采集,以频率f对语音信号进行采集,将采集的语音信号以Nbit进行量化,以形成足够长度的线性PCM文件,作为训练语音集;/nb).语音信号分帧,将步骤a)中获取的训练语音集按时间顺序以帧长Tms进行分帧,记分帧集合为M={m1、m2、…、mn},n为总帧数;/nc).提取子带清浊音度参数,从步骤b)中的每个分帧中提取5个子带清浊音度参数,记分帧Mi的5个子带清浊音度参数为Vi={vi1、vi2、…、vi5},并记录Mi中每个子带清浊音度参数的判决结果,i=1,2,…n;/nd).提取语音参数,提取每帧的声道参数Lsf、基音参数P、能量参数G,并进行归一化处理;记归一化处理后分帧Mi的声道参数、基音参数和能量参数分别为Lsfi、Pi、Gi,i=1,2,…n;/ne).训练支持向量机模型,以{ vi1、Lsfi、Pi、Gi}、{ vi2、Lsfi、Pi、Gi}、{ vi3、Lsfi、Pi、Gi}、{ vi4、 Lsfi、Pi、Gi}、{ vi5、Lsfi、Pi、Gi},i=1,2,…n,分别作为5个子带清浊音判决的支持向量机模型的训练数据,5个子带的清浊音判决结果作为对应支持向量机模型的标定值,对5个子带清浊音判决的支持向量机模型进行训练,经过多次迭代,得到训练好的5个子带清浊音判决的支持向量机模型;/n所述子带清浊音度参数恢复阶段通过以下步骤来实现:/n1).语音采集和分帧,编码端以频率f对输入的语音信号进行采样,并将采样后的语音信号按时间顺序进行分帧,设得到的帧数为m;/n2).语音参数的提取,编码端按帧从步骤1)获取的每个分帧中提取声道参数Lsf、基音参数P、能量参数G;/n3).编码和传输,编码端按帧对获取的声道参数、基音参数和能量参数进行量化编码,并将量化编码得到的参数索引传输到解码端,直至所有帧的参数索引传输完毕;/n4).反量化,在解码端根据索引值反量化得到各帧的参数,记得到的第j帧的声道参数为、基音参数为、能量参数为,j=1,2,…,m;/n5).重构清浊音度参数,在解码端,根据训练得到的5个子带清浊音判决的支持向量机模型,利用声道参数为、基音参数为、能量参数为,依次送入每个子带清浊音判决对应的支持向量机模型,计算出第j帧的5个子带清浊音度参数,最后将5个子带清浊音度参数送入激励信号合成端生成激励信号,以获取高质量的语音信号。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810232462.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top