[发明专利]基于支持向量机在语音解码端重构子带清浊音度参数的方法有效

申请号：	201810232462.4	申请日：	2018-03-21
公开（公告）号：	CN108461088B	公开（公告）日：	2019-11-19
发明（设计）人：	李晔;马晓凤;姜竞赛;郝秋赟;张鹏	申请（专利权）人：	山东省计算中心(国家超级计算济南中心)
主分类号：	G10L19/16	分类号：	G10L19/16;G10L19/04;G10L25/93;G10L19/08;G10L19/087
代理公司：	暂无信息	代理人：	暂无信息
地址：	250014 山东省济***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明的基于支持向量机在语音解码端重构子带清浊音度参数的方法，首先利用语音样本的5个子带清浊音度参数、声道参数、基音参数和能量参数训练出5个子带清浊音判决的支持向量机模型，在低速率声码器的解码端，利用线谱频率参数、基音周期参数、能量参数与子带清浊音度参数的相关性，对子带清浊音度参数进行重构。摒弃传统编码器中对子带清浊音度参数量化编码传输的方法，在声码器中引入支持向量机，利用线谱频率参数、基音周期参数和能量参数将子带清浊音度参数直接恢复出来，在不明显降低各子带清浊音判决准确率的前提下，节省的量化比特数，可用来量化其他更加重要的参数，整体上可以进一步提升合成语音的质量。
搜索关键词：	浊音度子带支持向量机能量参数重构基音周期线谱频率语音解码声码器支持向量机模型传统编码器量化比特数编码传输参数量化基音参数声道参数语音样本解码端判决准确率可用合成量化语音引入恢复
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于支持向量机在语音解码端重构子带清浊音度参数的方法，包括支持向量机模型训练阶段和子带清浊音度参数恢复阶段；其特征在于：支持向量机模型训练阶段，首先采集足够长的语音信号并对其进行分帧，然后提取分帧的5个子带清浊音度参数、声道参数、基音参数和能量参数，以形成支持向量机模型的训练数据，然后通过迭代的方式训练出5个子带清浊音判决的支持向量机模型；子带清浊音度参数恢复阶段，编码端采集语音信号并分帧，然后提取分帧的声道参数、基音参数和能量参数并对其量化编码和传输，解码端根据接收到的索引值反量化后得到声道参数、基音参数和能量参数，并利用训练好的5个子带清浊音判决的支持向量机模型重构子带清浊音度参数，以形成高质量的语音信号；/n所述支持向量机模型训练阶段通过以下步骤来实现：/na).语音信号采集，以频率f对语音信号进行采集，将采集的语音信号以Nbit进行量化，以形成足够长度的线性PCM文件，作为训练语音集；/nb).语音信号分帧，将步骤a)中获取的训练语音集按时间顺序以帧长Tms进行分帧，记分帧集合为M={m1、m2、…、mn}，n为总帧数；/nc).提取子带清浊音度参数，从步骤b)中的每个分帧中提取5个子带清浊音度参数，记分帧Mi的5个子带清浊音度参数为Vi={vi1、vi2、…、vi5}，并记录Mi中每个子带清浊音度参数的判决结果，i=1,2,…n；/nd).提取语音参数，提取每帧的声道参数Lsf、基音参数P、能量参数G，并进行归一化处理；记归一化处理后分帧Mi的声道参数、基音参数和能量参数分别为Lsfi、Pi、Gi，i=1,2,…n；/ne).训练支持向量机模型，以{ vi1、Lsfi、Pi、Gi}、{ vi2、Lsfi、Pi、Gi}、{ vi3、Lsfi、Pi、Gi}、{ vi4、 Lsfi、Pi、Gi}、{ vi5、Lsfi、Pi、Gi}，i=1,2,…n，分别作为5个子带清浊音判决的支持向量机模型的训练数据，5个子带的清浊音判决结果作为对应支持向量机模型的标定值，对5个子带清浊音判决的支持向量机模型进行训练，经过多次迭代，得到训练好的5个子带清浊音判决的支持向量机模型；/n所述子带清浊音度参数恢复阶段通过以下步骤来实现：/n1).语音采集和分帧，编码端以频率f对输入的语音信号进行采样，并将采样后的语音信号按时间顺序进行分帧，设得到的帧数为m；/n2).语音参数的提取，编码端按帧从步骤1)获取的每个分帧中提取声道参数Lsf、基音参数P、能量参数G；/n3).编码和传输，编码端按帧对获取的声道参数、基音参数和能量参数进行量化编码，并将量化编码得到的参数索引传输到解码端，直至所有帧的参数索引传输完毕；/n4).反量化，在解码端根据索引值反量化得到各帧的参数，记得到的第j帧的声道参数为、基音参数为、能量参数为，j=1,2,…，m；/n5).重构清浊音度参数，在解码端，根据训练得到的5个子带清浊音判决的支持向量机模型，利用声道参数为、基音参数为、能量参数为，依次送入每个子带清浊音判决对应的支持向量机模型，计算出第j帧的5个子带清浊音度参数，最后将5个子带清浊音度参数送入激励信号合成端生成激励信号，以获取高质量的语音信号。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心)，未经山东省计算中心(国家超级计算济南中心)许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810232462.4/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于支持向量机在语音解码端重构子带清浊音度参数的方法有效

专利文献下载