[发明专利]多模式多级码本联合优化方法有效
申请号: | 201510121820.0 | 申请日: | 2015-03-19 |
公开(公告)号: | CN104795074B | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 徐敬德;崔慧娟;唐昆 | 申请(专利权)人: | 清华大学;信瑞递(北京)科技有限公司 |
主分类号: | G10L19/038 | 分类号: | G10L19/038;G10L19/107 |
代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 朱绘;张文娟 |
地址: | 100084 北京市海淀区1*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模式 多级 联合 优化 方法 | ||
本发明公开了一种多模式多级码本联合优化方法,属于低速率语音编码矢量量化技术领域,解决了现有的多模式多级码本训练中,误码对系统失真的影响较大的技术问题。该多模式多级码本联合优化方法包括:输出待量化矢量;对所述待量化矢量进行训练,获得各模式各级初始化码本;对所述各模式各级初始化码本进行码本索引的重排,获得新的码本;对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和量化索引;利用输入残差矢量和对应的量化索引,更新各级各模式最优码字,并迭代至预设次数;获取最后一次迭代得出的码本。
技术领域
本发明涉及低速率语音编码矢量量化技术领域,具体地说,涉及一种多模式多级码本联合优化方法。
背景技术
随着音频技术的发展,低速率语音编码在无线通信、卫星通信等领域有着广泛的应用。
在低速率语音编码中,由于受到存储量及运算量的限制,往往采用受约束的矢量量化方式,其中包括树型矢量量化、分类矢量量化、多级矢量量化、变换域矢量量化等,以降低码本的存储量和运算量。其中,以多级矢量量化最为常用。另一方面,分模式矢量量化虽然会增加一定的存储量,但是它可以在不额外增加比特的情况下,有效的降低量化误差。在低速率语音编码的众多应用领域中,往往时刻伴随着误码的存在。对于多模式多级矢量量化,一旦发生误码,不仅各级码本索引会出错,而且模式的选择也会出错,这样在解码端合成的参数往往与编码端的输入参数出现较大的偏差,严重影响合成语音的可懂度和舒适度。
传统的分模式多级矢量量化,以信源最优为准则进行码本训练和码本的联合优化,由于不考虑信道误码情况,信源最优的多模式多级矢量量化的系统失真即为量化失真。这样训练出来的最优码字均匀分布在整个量化空间中,而一旦发生误码,整个系统失真也会比较大。
基于上述情况,现有的多模式多级码本训练中,误码对系统失真的影响较大,影响了对反量化码字以及合成语音的质量。
发明内容
本发明的目的在于提供一种多模式多级码本联合优化方法,以解决现有的多模式多级码本训练中,误码对系统失真的影响较大的技术问题。
本发明提供一种多模式多级码本联合优化方法,包括:
步骤1,输出待量化矢量;
步骤2,对所述待量化矢量进行训练,获得各模式各级初始化码本,其中,级数为M;
步骤3,对所述各模式各级初始化码本进行码本索引的重排,获得新的码本;
步骤4,对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和量化索引;
步骤5,对于第m级码本,利用本级的输入残差矢量和对应的量化索引,更新本级各模式最优码字,其中,m的初始值为1;
步骤6,比较m与M的值;
如果m<M,则将m的值加1,并返回步骤4;
如果m=M,则进行步骤7;
步骤7,判断迭代次数t是否达到预设值T,其中,t的初始值为1;
如果t<T,则将t的值加1,将m的值重置为1,并返回步骤4;
如果t=T,则进行步骤8;
步骤8,获取最后一次迭代得出的码本。
优选的是,所述步骤1,具体为:
在低速率语音编码中,对语音库根据分模式依据参数的量化索引作为模式的编号,输出待量化参数在各模式下待量化矢量。
所述语音库优选为具有设定采样频率的、具有一定时长的、包含多种音色的标准中文语音库。所述设定采样频率优选为8kHz。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;信瑞递(北京)科技有限公司,未经清华大学;信瑞递(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510121820.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频侦测方法
- 下一篇:一种提高语音识别率的方法和电子设备