[发明专利]基于生成对抗网络的频带扩展方法、编解码方法及系统有效
申请号: | 202210322549.7 | 申请日: | 2022-03-30 |
公开(公告)号: | CN114420140B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 李强;朱勇;叶东翔;王尧 | 申请(专利权)人: | 北京百瑞互联技术有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/16;G10L25/30;G06N3/04;G06N3/08 |
代理公司: | 北京国科程知识产权代理事务所(普通合伙) 11862 | 代理人: | 曹晓斐 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 频带 扩展 方法 解码 系统 | ||
1.一种基于生成对抗网络的频带扩展方法,其特征在于,包括:
在音频编码或解码过程中,通过LC3音频编码器或解码器对输入的音频数据进行特征提取,确定其对应的谱系数;
对所述谱系数进行带宽检测,得到带宽指示;
若所述带宽指示为窄带宽,则通过预训练的生成网络对所述窄带宽对应的低频谱系数进行扩展,得到高频谱系数;
将所述低频谱系数和所述高频谱系数组合,得到宽带谱系数,其中,所述生成网络的预训练过程包括:
获取宽带语音,并对所述宽带语音进行滤波,得到窄带语音,其中所述宽带语音具有宽带宽,所述窄带语音仅具有窄带宽;
分别对所述宽带语音和所述窄带语音进行特征提取,得到所述宽带语音对应的真宽带谱系数和所述窄带语音对应的窄带谱系数;
根据所述真宽带谱系数和从所述窄带谱系数中提取的所述低频谱系数对所述生成网络进行训练,使得所述生成网络能够根据所述窄带谱系数生成所述高频谱系数。
2.根据权利要求1所述的基于生成对抗网络的频带扩展方法,其特征在于,所述通过LC3音频编码器或解码器对输入的音频数据进行特征提取,确定其对应的谱系数,包括:
在LC3音频编码器的音频编码过程中,通过对所述音频数据进行低延迟改进型离散余弦变换,得到所述谱系数,或
在LC3音频解码器的音频解码过程中,对输入的解码音频数据解码至变换域噪声整形步骤,得到所述谱系数。
3.根据权利要求1所述的基于生成对抗网络的频带扩展方法,其特征在于,所述生成网络的预训练过程还包括:
将所述低频谱系数和所述高频谱系数组合,得到假宽带谱系数;
通过判别网络对所述真宽带谱系数和所述假宽带谱系数进行判断,对所述生成网络进行优化。
4.一种频带扩展的音频编解码方法,其特征在于,包括:
在音频编码或解码过程中,通过LC3音频编码器或解码器对输入的音频数据进行特征提取,确定其对应的谱系数;
对所述谱系数进行带宽检测,得到带宽指示;
若所述带宽指示为窄带宽,则通过预训练的生成网络对所述窄带宽对应的低频谱系数进行扩展,得到高频谱系数;
将所述低频谱系数和所述高频谱系数组合,得到宽带谱系数
所述LC3音频编码器或解码器根据所述宽带谱系数对所述音频数据进行编码或解码,其中所述生成网络的预训练过程包括:
获取宽带语音,并对所述宽带语音进行滤波,得到窄带语音,其中所述宽带语音具有宽带宽,所述窄带语音仅具有窄带宽;
分别对所述宽带语音和所述窄带语音进行离散余弦变换,得到所述宽带语音对应的宽带谱系数和所述窄带语音对应的窄带谱系数;
根据所述宽带谱系数和从所述窄带谱系数中提取的所述低频谱系数对所述生成网络进行训练,使得所述生成网络能够根据所述窄带谱系数生成所述高频谱系数。
5.一种频带扩展系统,其特征在于,包括:
特征提取模块,其在LC3音频编解码器的音频编码或解码过程中,对输入的音频数据进行特征提取,确定其对应的谱系数;
带宽检测模块,其对所述谱系数进行带宽检测,得到带宽指示;
带宽扩展模块,若所述带宽指示为窄带宽,则其通过预训练的生成网络对所述窄带宽对应的低频谱系数进行扩展,得到高频谱系数,并将所述低频谱系数和所述高频谱系数组合,得到宽带谱系数,其中,所述生成网络的预训练过程包括:
获取宽带语音,并对所述宽带语音进行滤波,得到窄带语音,其中所述宽带语音具有宽带宽,所述窄带语音仅具有窄带宽;
分别对所述宽带语音和所述窄带语音进行特征提取,得到所述宽带语音对应的真宽带谱系数和所述窄带语音对应的窄带谱系数;
根据所述真宽带谱系数和从所述窄带谱系数中提取的所述低频谱系数对所述生成网络进行训练,使得所述生成网络能够根据所述窄带谱系数生成所述高频谱系数。
6.一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行权利要求1-3或4任一项所述的方法。
7.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机指令,其中:所述处理器操作计算机指令以执行权利要求1-3或4任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百瑞互联技术有限公司,未经北京百瑞互联技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210322549.7/1.html,转载请声明来源钻瓜专利网。