[发明专利]多模式多级码本联合优化方法有效
申请号: | 201510121820.0 | 申请日: | 2015-03-19 |
公开(公告)号: | CN104795074B | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 徐敬德;崔慧娟;唐昆 | 申请(专利权)人: | 清华大学;信瑞递(北京)科技有限公司 |
主分类号: | G10L19/038 | 分类号: | G10L19/038;G10L19/107 |
代理公司: | 北京聿宏知识产权代理有限公司 11372 | 代理人: | 朱绘;张文娟 |
地址: | 100084 北京市海淀区1*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模式 多级 联合 优化 方法 | ||
1.一种多模式多级码本联合优化方法,其特征在于,包括:
步骤1,输出待量化矢量;
步骤2,对所述待量化矢量进行训练,获得各模式各级初始化码本,其中,级数为M;
步骤3,对所述各模式各级初始化码本进行码本索引的重排,获得新的码本;
步骤4,对所述待量化矢量,利用新的码本,寻找使得系统失真最小的最优胞腔和量化索引;
步骤5,对于第m级码本,利用本级的输入残差矢量和对应的量化索引,更新本级各模式最优码字,其中,m的初始值为1;
步骤6,比较m与M的值;
如果m<M,则将m的值加1,并返回步骤4;
如果m=M,则进行步骤7;
步骤7,判断迭代次数t是否达到预设值T,其中,t的初始值为1;
如果t<T,则将t的值加1,将m的值重置为1,并返回步骤4;
如果t=T,则进行步骤8;
步骤8,获取最后一次迭代得出的码本,
其中,在步骤5中,对于第m级码本,利用本级的输入残差矢量和对应的量化索引,更新本级各模式最优码字,表示为:
其中,x表示输入矢量,p(x)表示x的分布概率,
第u模式第m级的输入残差矢量表示为:
索引到索引的误码转移概率表示为:
其中,p(v|u)表示模式u到模式v的误码转移概率,即这里,q表示信道误码率,C表示模式索引的比特数,h(u,v)表示模式u与模式v的汉明距;p(jm|im)表示同一模式下第m级索引到索引的误码转移概率,即,这里,Bm表示第m级码字索引的比特数,hm(im,jm)表示索引im与索引jm的汉明距。
2.根据权利要求1所述的方法,其特征在于,所述步骤1,具体为:
在低速率语音编码中,对语音库根据分模式依据参数的量化索引作为模式的编号,输出待量化参数在各模式下待量化矢量。
3.根据权利要求2所述的方法,其特征在于,所述语音库为具有设定采样频率的、具有一定时长的、包含多种音色的标准中文语音库。
4.根据权利要求3所述的方法,其特征在于,所述设定采样频率为8kHz。
5.根据权利要求1所述的方法,其特征在于,所述步骤2,具体为:
将各模式待量化矢量作为码本训练和联合优化的输入矢量,分别采用基于模拟退火的码本训练方法,按照各级分配的比特数进行多级码本训练,获得各模式各级初始化码本。
6.根据权利要求1所述的方法,其特征在于,所述步骤3,具体为:
对所述各模式各级初始化码本,采用基于禁忌搜索的方法进行码本索引的重排,获得新的码本。
7.根据权利要求1所述的方法,其特征在于,T的取值范围在20至40之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;信瑞递(北京)科技有限公司,未经清华大学;信瑞递(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510121820.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频侦测方法
- 下一篇:一种提高语音识别率的方法和电子设备