[发明专利]一种语音编码器码流的转码方法在审
申请号: | 201310598532.5 | 申请日: | 2013-11-20 |
公开(公告)号: | CN104658539A | 公开(公告)日: | 2015-05-27 |
发明(设计)人: | 盖丽 | 申请(专利权)人: | 大连佑嘉软件科技有限公司 |
主分类号: | G10L19/002 | 分类号: | G10L19/002;G10L19/035;G10L19/18 |
代理公司: | 无 | 代理人: | 无 |
地址: | 116011 辽宁省大连*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 编码器 方法 | ||
技术领域
本发明涉及一种语音编码器码流的转码方法,属于语音编解码技术领域。
背景技术
不同的通信网络常使用不同的语音编码标准。为了保证通信网络间的互通性,在通信网络之间连接时,常需要在不同编码器之间进行“转码”。设通信网1使用A型语音编解码器,通信网2使用B型语音编解码器。传统的语音转码方法是以先解码再编码(DTE)的方式进行转码,即用通信网1所使用的A型语音解码器对接收到的比特流进行解码,得到时间域的语音信号,然后再用通信网2所使用的B型语音编码器对该时间域语音信号进行编码,将编码后的比特流发送到通信网2。这种转码方法的计算复杂度高,时延较大,所需的存储量也较大,两次编解码也使合成语音质量不高。
发明内容
本发明针对以上问题的提出,而研制一种语音编码器码流的转码方法。
一种语音编码器码流的转码方法,其特征在于:通信网1发送的A码流经过比特流解析单元,解码单元,参数转换单元、编码单元和比特流封装单元得到通信网2接收的B码流,通信网1、2是使用不同语音编码标准的通信网络,例如使用AMR标准的无线网,使用G.729AB标准的IP网。
本发明技术方案带来的有益效果如下:
(1)由于对线谱对系数转码时,事先使用了支持向量回归(SVR)算法对大量语音数据进行训练,从而得到发送端线谱对系数与接收端线谱对系数的映射模型。在此基础上,进行输入线谱对系数到输出线谱对系数的映射,使线谱对系数的转换更为精确,提高了合成语音的质量。
(2)将解码所得的基音延迟整数部分T0作为编码端开环搜索结果,这样在进行闭环搜索时,可根据T0的值来限制闭环搜索范围,从而提高了合成语音质量,也使计算量有所减小。
(3)在静音插入描述帧的转码过程中,采用能量参数直接映射的方法,去掉了静音插入描述帧能量的计算,使得算法复杂度降低,存储量相应减少。
(4)从输入的比特流中提取帧类型信息,这样就可在转码过程中不进行帧类型判断,而直接在比特流输出时将帧类型转换为与接收到的帧类型相同,有效地提高了接收端的合成语音质量。
附图说明
图1是本发明的流程图。
图2是本发明的语音帧转码方法流程图。
图3是本发明的静音插入描述帧参数转码方法流程图。
图4AMR到G.729AB转码的DTE方法与本发明转码方法的PESQ比较。
图5AMR到G.729AB转码的DTE方法与本发明转码方法的WMOPS比较。
具体实施方式
下面结合附图对本发明做进一步说明:
如图1所示:通信网1发送的A码流经过比特流解析单元,解码单元,参数转换单元、编码单元和比特流封装单元得到通信网2接收的B码流,所述通信网1、2是使用不同语音编码标准的通信网络。
这里以AMR到G.729AB的参数转码过程为例,阐述本发明的具体实现过程,即上述A编码标准为AMR,B编码标准为G.729AB,通信网1为无线通信网,通信网2为IP网。AMR帧长为20ms,G.729AB帧长为10ms,两者子帧长度都为5ms,AMR一帧对应G.729AB两帧。转码具体方案如下:
比特流解析单元用于接收无线通信网发送的AMR码流,具体步骤如下:
(1)根据AMR的帧结构,从接收到的AMR码流中依次提取帧类型(SPEECH_GOOD、SPEECH_BAD、SID_FIRST、SID_UPDATE、SID_BAD、NO_DATA)、模式信息(MR_4.75kbps、MR_5.15kbps、MR_5.9kbps、MR_6.7kbps、MR_7.4kbps、MR_10.2kbps、MR_12.2kbps)和参数比特。
(2)根据AMR的帧结构,将参数比特转化为量化编码后的参数值,即语音帧的线谱对系数、基音延迟、固定码本非零脉冲位置和符号及增益,或静音插入描述帧的线谱对系数和语音能量。
(3)根据帧类型信息判断当前帧为语音帧(SPEECH_GOOD、SPEECH_BAD)、静音插入描述帧(SID_UPDATE、SID_BAD)或非传输帧(SID_FIRST、NO_DATA)
解码单元用于AMR解码器从参数比特中解码,得到语音参数值及合成语音,具体步骤如下:
(1)若当前帧为语音帧:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连佑嘉软件科技有限公司;,未经大连佑嘉软件科技有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310598532.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多媒体播放方法及装置
- 下一篇:一种基于鸟鸣声的移动式鸟类识别方法