[发明专利]一种基于自适应带宽判断的带宽扩展方法及系统有效
申请号: | 201711394223.0 | 申请日: | 2017-12-21 |
公开(公告)号: | CN108198571B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 白海钏;张鹏远;颜永红;郭亮;王天宝 | 申请(专利权)人: | 中国科学院声学研究所;腾讯科技(北京)有限公司 |
主分类号: | G10L21/038 | 分类号: | G10L21/038;G10L21/0208;G10L25/18;G10L25/30;G10L25/93 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 陈琳琳;李彪 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 带宽 判断 扩展 方法 系统 | ||
1.一种基于自适应带宽判断的带宽扩展方法,所述方法包括:
步骤1)根据设置的语音信号的输入采样率和输出采样率,对输入语音信号x(n)进行采样率转换,输出信号y(n),其采样率为输出采样率;
步骤2)计算信号y(n)的帧能量值,依次对信号y(n)进行低通、带通和高通滤波处理,计算处理后信号与信号y(n)的帧能量值的比值,将比值与相应阈值进行比较,从而判定信号的有效频带宽度是否存在,并根据判定结果进一步判定是否需要对信号y(n)进行带宽扩展,如果需要,转入步骤3),否则,直接将输入信号y(n)进行输出;
步骤3)对信号y(n)的进行带宽扩展,然后输出;
所述步骤1)具体为:
设输入采样率为SRin,输出采样率为SRout;
当满足SRout=SRin条件时,输出信号y(n)为输入语音信号x(n);
当满足SRout=2*SRin条件时,对输入语音信号x(n)进行上二采样和低通滤波处理,得到采样率加倍而带宽不变的信号y(n);
所述步骤2)具体包括:
步骤2-1)计算信号y(n)的帧能量值E;
步骤2-2)将信号y(n)采用截止频率为FL的低通滤波器进行处理,得到滤波后的信号,计算该信号y(n)的帧能量值ELW,然后,计算能量比例RL=ELW/E,将RL与第一阈值R1进行比较,若大于第一阈值R1,则判定该带宽成分存在,然后,转入步骤2-3);否则,直接将信号y(n)进行输出;其中,FL表示较低带宽频率值;
步骤2-3)将信号y(n)采用上下截止频率分别为FL和FH的带通滤波器进行处理,得到滤波后的信号,计算该信号的帧能量值EBW,然后计算能量比例RB=EBW/E,将RB与第二阈值R2进行比较,若大于第二阈值R2,则判定该带宽成分存在,然后转入步骤2-4);否则,转入步骤3),进行当前采样率下FL~FH的带宽扩展;其中,FH表示较高带宽频率值;
步骤2-4)将信号y(n)采用截止频率为FH,FHFMAX的高通滤波器进行处理,得到滤波后的信号;计算该信号的帧能量值EHW,然后计算能量比例RH=EHW/E,将RH与第三阈值R3进行比较,若大于第三阈值R3,则判定该带宽成分存在,直接将信号y(n)进行输出;否则,转入步骤3),进行当前采样率下FH~FMAX的带宽扩展处理;FMAX表示在某一固定采样率下语音信号所能达到的最大带宽频率值;
所述步骤3)之前还包括:
根据不同采样率和带宽的训练样本数据,采用线性预测分析、高斯混合模型、隐马尔可夫模型或深度神经网络,训练出固定采样率下针对带宽FL~FH范围进行扩展的中频带宽扩展模型和固定采样率下针对带宽FH~FMAX范围进行扩展的高频带宽扩展模型;所述步骤3)具体包括:
若y(n)已包含0~FL带宽成分但不包含FL~FH带宽成分,采用中频带宽扩展模型进行扩展;
若y(n)已包含0~FL带宽成分和FL~FH带宽成分但不包含FH~FMAX带宽成分,则采用高频带宽扩展模型进行扩展;
最后,将带宽扩展后的信号进行输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;腾讯科技(北京)有限公司,未经中国科学院声学研究所;腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711394223.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:审讯时语音分离的方法及装置
- 下一篇:一种音频处理方法及装置