[发明专利]语音参数量化方法、装置、计算机设备和存储介质在审
申请号: | 201811109230.6 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109256143A | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 袁念德 | 申请(专利权)人: | 西安蜂语信息科技有限公司 |
主分类号: | G10L19/16 | 分类号: | G10L19/16;G10L19/00;G10L19/032 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 王程 |
地址: | 710077 陕西省西安市高*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音参数 量化 计算机设备 存储介质 速率和 参数分析 灵活设置 语音信号 传输 预设 场景 申请 | ||
本申请涉及一种语音参数量化方法、装置、计算机设备和存储介质。所述方法包括:采用预设的参数分析方法获取语音信号的语音参数;根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。采用本方法能够可以针对不同的传输速率和语音参数灵活设置不同的量化方法,适用于不同的场景中,满足用户的不同需求。
技术领域
本申请涉及音频编码技术领域,特别是涉及一种语音参数量化方法、装置、计算机设备和存储介质。
背景技术
声码器是一种对话音进行分析和合成的编译码器,也称话音分析合成系统或话音频带压缩系统,是压缩话音通信频带和进行保密通信的有力工具。
声码器可以分为编码器和解码器,编码器将音频信号转化为比特流用于信道传输,解码器从比特流中恢复出用于语音合成的参数进行语音合成,输出音频数据。目前,编码器常用的语音参数量化方法包括互联网低比特率编码(Internet Low Bitrate Codec,ILBC)、增强型可变速率编解码器(Enhanced Variable Rate Codec,EVRC)、自适应多速率语音编码(Adaptive Multi Rate,AMR)等方法。
但是,上述语音参数量化方法不够灵活,不能适应各种场景。
发明内容
基于此,有必要针对上述技术问题,提供一种能够灵活适应多种场景的语音参数量化方法、装置、计算机设备和存储介质。
一种语音参数量化方法,所述方法包括:
采用预设的参数分析方法获取语音信号的语音参数;
根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化。
在其中一个实施例中,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:
若所述语音信号的传输速率为2400bps,且所述语音参数为基音周期,则根据所述语音信号的周期属性或传输所述语音信号的当前帧的清浊类型,对所述基音周期进行量化。
在其中一个实施例中,所述根据所述语音信号的周期属性或传输所述语音信号的当前帧的清浊类型,对所述基音周期进行量化,包括:
若所述当前帧为浊音帧,则对所述语音信号在所述当前帧的基音周期进行对数转换,并采用预设阶数对转换结果进行均匀量化;
若所述当前帧为清音帧,或者,所述语音信号的周期属性为非周期,则对所述语音信号的基音周期进行比特量化。
在其中一个实施例中,若所述当前帧为清音帧,或者,所述语音信号的周期属性为非周期,则对所述语音信号的基音周期进行比特量化,包括:
若所述当前帧为清音帧,则将所述语音信号的基音周期对应的比特位均量化为第一值;
若所述语音信号的周期属性为非周期,则将所述语音信号的基音周期对应的比特位均量化为第二值。
在其中一个实施例中,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:
若所述语音信号的传输速率为2400bps,且所述语音参数为线谱对LSF参数,则采用预设的三级矢量码本对所述LSF参数进行量化。
在其中一个实施例中,所述根据所述语音信号的传输速率和所述语音参数,确定与所述语音参数对应的量化方法对所述语音参数进行量化,包括:
若所述语音信号的传输速率为1200bps,则根据传输所述语音信号的时间帧的清浊类型确定所述语音信号的超帧模式;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安蜂语信息科技有限公司,未经西安蜂语信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811109230.6/2.html,转载请声明来源钻瓜专利网。