[发明专利]基于支持向量机在语音解码端重构子带清浊音度参数的方法有效
申请号: | 201810232462.4 | 申请日: | 2018-03-21 |
公开(公告)号: | CN108461088B | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 李晔;马晓凤;姜竞赛;郝秋赟;张鹏 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心) |
主分类号: | G10L19/16 | 分类号: | G10L19/16;G10L19/04;G10L25/93;G10L19/08;G10L19/087 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 浊音度 子带 支持向量机 能量参数 重构 基音周期 线谱频率 语音解码 声码器 支持向量机模型 传统编码器 量化比特数 编码传输 参数量化 基音参数 声道参数 语音样本 解码端 判决 准确率 可用 合成 量化 语音 引入 恢复 | ||
本发明的基于支持向量机在语音解码端重构子带清浊音度参数的方法,首先利用语音样本的5个子带清浊音度参数、声道参数、基音参数和能量参数训练出5个子带清浊音判决的支持向量机模型,在低速率声码器的解码端,利用线谱频率参数、基音周期参数、能量参数与子带清浊音度参数的相关性,对子带清浊音度参数进行重构。摒弃传统编码器中对子带清浊音度参数量化编码传输的方法,在声码器中引入支持向量机,利用线谱频率参数、基音周期参数和能量参数将子带清浊音度参数直接恢复出来,在不明显降低各子带清浊音判决准确率的前提下,节省的量化比特数,可用来量化其他更加重要的参数,整体上可以进一步提升合成语音的质量。
技术领域
本发明涉及一种重构子带清浊音度参数的方法,更具体的说,尤其涉及一种基于支持向量机在语音解码端重构子带清浊音度参数的方法。
背景技术
语音编码在通信系统、语音存储回放系统、具有语音功能的消费类产品中有广泛的应用。近些年来国际电信联盟(ITU)、一些区域组织和国家相继制定了一系列语音压缩编码标准,在编码速率为2.4kb/s到16kb/s上得到了令人满意的语音质量。目前国内外的研究主要集中在2.4kb/s以下速率高质量语音压缩编码上,主要用于无线通信、保密通信、大容量语音存储回放等。其中,混合激励线性预测编码模型得到了广泛采用,表现优异。在混合激励线性预测编码模型中,解码端采用了多带激励信号合成,合成过程需要依靠表征各子带清浊音判决结果的子带清浊音度参数。目前,解码端获取子带清浊音度参数的方法如下:
(1)对输入语音信号样点按时间顺序分帧;
(2)按帧提取子带清浊音度参数;
(3)对子带清浊音度参数进行矢量量化,将其量化索引值进行编码传输,量化码本的训练方法可参照杨行峻等人著《语音信号数字处理》矢量量化一章中所采用的LBG算法;
(4)解码端根据索引值搜索码本得到子带清浊音度参数;送入激励信号合成端生成激励信号。
低速率语音编码中,量化比特数有限,是宝贵的资源。子带清浊音度参数需要进行量化传输,从而占用了可观的量化比特数。而实验证明,在混合激励线性预测编码模型中,子带清浊音度参数同其他语音编码参数间仍然具有一定的相关性。在现有的语音编码技术中,没有充分利用这种相关性来进一步提高语音编码的效率。
发明内容
本发明为了克服上述技术问题的缺点,提供了一种基于支持向量机在语音解码端重构子带清浊音度参数的方法。
本发明的基于支持向量机在语音解码端重构子带清浊音度参数的方法,包括支持向量机模型训练阶段和子带清浊音度参数恢复阶段;其特征在于:支持向量机模型训练阶段,首先采集足够长的语音信号并对其进行分帧,然后提取分帧的5个子带清浊音度参数、声道参数、基音参数和能量参数,以形成支持向量机模型的训练数据,然后通过迭代的方式训练出5个子带清浊音判决的支持向量机模型;子带清浊音度参数恢复阶段,编码端采集语音信号并分帧,然后提取分帧的声道参数、基音参数和能量参数并对其量化编码和传输,解码端根据接收到的索引值反量化后得到声道参数、基音参数和能量参数,并利用训练好的5个子带清浊音判决的支持向量机模型重构子带清浊音度参数,以形成高质量的语音信号。
本发明的基于支持向量机在语音解码端重构子带清浊音度参数的方法,所述支持向量机模型训练阶段通过以下步骤来实现:
a).语音信号采集,以频率f对语音信号进行采集,将采集的语音信号以Nbit进行量化,以形成足够长度的线性PCM文件,作为训练语音集;
b).语音信号分帧,将步骤a)中获取的训练语音集按时间顺序以帧长Tms进行分帧,记分帧集合为M={m1、m2、…、mn},n为总帧数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810232462.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数字信号穿过声码器的装置及方法
- 下一篇:基于流媒体技术的视频综合系统