[发明专利]基于支持向量机在语音解码端重构子带清浊音度参数的方法有效
申请号: | 201810232462.4 | 申请日: | 2018-03-21 |
公开(公告)号: | CN108461088B | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 李晔;马晓凤;姜竞赛;郝秋赟;张鹏 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心) |
主分类号: | G10L19/16 | 分类号: | G10L19/16;G10L19/04;G10L25/93;G10L19/08;G10L19/087 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 浊音度 子带 支持向量机 能量参数 重构 基音周期 线谱频率 语音解码 声码器 支持向量机模型 传统编码器 量化比特数 编码传输 参数量化 基音参数 声道参数 语音样本 解码端 判决 准确率 可用 合成 量化 语音 引入 恢复 | ||
1.一种基于支持向量机在语音解码端重构子带清浊音度参数的方法,包括支持向量机模型训练阶段和子带清浊音度参数恢复阶段;其特征在于:支持向量机模型训练阶段,首先采集足够长的语音信号并对其进行分帧,然后提取分帧的5个子带清浊音度参数、声道参数、基音参数和能量参数,以形成支持向量机模型的训练数据,然后通过迭代的方式训练出5个子带清浊音判决的支持向量机模型;子带清浊音度参数恢复阶段,编码端采集语音信号并分帧,然后提取分帧的声道参数、基音参数和能量参数并对其量化编码和传输,解码端根据接收到的索引值反量化后得到声道参数、基音参数和能量参数,并利用训练好的5个子带清浊音判决的支持向量机模型重构子带清浊音度参数,以形成高质量的语音信号;
所述支持向量机模型训练阶段通过以下步骤来实现:
a).语音信号采集,以频率f对语音信号进行采集,将采集的语音信号以Nbit进行量化,以形成足够长度的线性PCM文件,作为训练语音集;
b).语音信号分帧,将步骤a)中获取的训练语音集按时间顺序以帧长Tms进行分帧,记分帧集合为M={m1、m2、…、mn},n为总帧数;
c).提取子带清浊音度参数,从步骤b)中的每个分帧中提取5个子带清浊音度参数,记分帧Mi的5个子带清浊音度参数为Vi={vi1、vi2、…、vi5},并记录Mi中每个子带清浊音度参数的判决结果,i=1,2,…n;
d).提取语音参数,提取每帧的声道参数Lsf、基音参数P、能量参数G,并进行归一化处理;记归一化处理后分帧Mi的声道参数、基音参数和能量参数分别为Lsfi、Pi、Gi,i=1,2,…n;
e).训练支持向量机模型,以{ vi1、Lsfi、Pi、Gi}、{ vi2、Lsfi、Pi、Gi}、{ vi3、Lsfi、Pi、Gi}、{ vi4、 Lsfi、Pi、Gi}、{ vi5、Lsfi、Pi、Gi},i=1,2,…n,分别作为5个子带清浊音判决的支持向量机模型的训练数据,5个子带的清浊音判决结果作为对应支持向量机模型的标定值,对5个子带清浊音判决的支持向量机模型进行训练,经过多次迭代,得到训练好的5个子带清浊音判决的支持向量机模型;
所述子带清浊音度参数恢复阶段通过以下步骤来实现:
1).语音采集和分帧,编码端以频率f对输入的语音信号进行采样,并将采样后的语音信号按时间顺序进行分帧,设得到的帧数为m;
2).语音参数的提取,编码端按帧从步骤1)获取的每个分帧中提取声道参数Lsf、基音参数P、能量参数G;
3).编码和传输,编码端按帧对获取的声道参数、基音参数和能量参数进行量化编码,并将量化编码得到的参数索引传输到解码端,直至所有帧的参数索引传输完毕;
4).反量化,在解码端根据索引值反量化得到各帧的参数,记得到的第j帧的声道参数为、基音参数为、能量参数为,j=1,2,…,m;
5).重构清浊音度参数,在解码端,根据训练得到的5个子带清浊音判决的支持向量机模型,利用声道参数为、基音参数为、能量参数为,依次送入每个子带清浊音判决对应的支持向量机模型,计算出第j帧的5个子带清浊音度参数,最后将5个子带清浊音度参数送入激励信号合成端生成激励信号,以获取高质量的语音信号。
2.根据权利要求1所述的基于支持向量机在语音解码端重构子带清浊音度参数的方法,其特征在于:步骤a)和步骤1)中采用8kHz的频率f进行信号采集,步骤a)中以16bit的长度对语音信号进行量化,步骤b)和步骤1)中以20ms或25ms的帧长对语音信号进行分帧。
3.根据权利要求1或2所述的基于支持向量机在语音解码端重构子带清浊音度参数的方法,其特征在于:步骤e)中,5个子带清浊音判决的支持向量机模型的核函数选择径向基函数。
4.根据权利要求1或2所述的基于支持向量机在语音解码端重构子带清浊音度参数的方法,其特征在于:步骤5)中,首先利用第一子带清浊音判决的支持向量机模型判别第1子带为清音还是浊音,若为清音,则后面4个子带皆为清音,无需再重复判别;若第一子带为浊音,则利用其余四个训练好的子带清浊音判决的支持向量机模型,分别判别剩余4个子带为清音还是浊音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810232462.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数字信号穿过声码器的装置及方法
- 下一篇:基于流媒体技术的视频综合系统