[发明专利]一种广播通信场景的近端语音可懂度增强方法和系统在审

专利信息
申请号: 202310049766.8 申请日: 2023-02-01
公开(公告)号: CN116129928A 公开(公告)日: 2023-05-16
发明(设计)人: 李军锋;李伟;顾建军 申请(专利权)人: 中国科学院声学研究所
主分类号: G10L21/0232 分类号: G10L21/0232;G10K11/178
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 陈霁
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 广播 通信 场景 语音 可懂度 增强 方法 系统
【说明书】:

发明实施例公开了一种适用于广播通信场景的近端语音可懂度增强方法和系统。该近端语音可懂度增强方法,首先在近端估计出语音和噪声,然后基于语音和噪声利用近端语音可懂度增强算法得到频带增益,最后将频带增益应用于原始的广播语音得到可懂度增强后的语音并在远端进行播放。本发明提供的实施例公开的一种广播通信场景的近端语音可懂度增强系统,将上述方法在基于卡尔曼估计方法和可懂度增强算法应用场景所对应的广播系统中实现。该系统提高了语音的通信质量,并且算法计算量较小,使得系统可以实现实时运行。

技术领域

本发明涉及语音可懂度增强领域,尤其涉及一种广播通信场景的近端语音可懂度增强方法和系统。

背景技术

近端语音可懂度增强是一种在嘈杂的近端听音环境中再现远端清晰语音的感知增强技术。在广播通信系统中,来自远端广播的语音信号通常需要在近端听者处的嘈杂环境中再现,为了减弱近端背景噪声对语音的干扰,需要对远端的广播语音进行预处理,来提高远端语音在听者处的可懂度,达到远程信息传递的目的。预处理的过程通常利用近端噪声的特性对原始语音频谱进行相应的修改,使其在该噪声条件下具备更高的可懂度。

目前,大多数近端语音可懂度增强算法都假设远端纯净语音和近端背景噪声已知,但是在实际通信应用中,听者处的远端语音和近端噪声通常难以分离。可以分为两种通用场景:一是听者和播放语音距离很近的手机通信场景,这种情况语音被认为没有发生反射和衰减,手机播放的远端语音和近端背景噪声同时被麦克风收录,通常使用传统噪声估计方法即可将两者分离;第二种场景是听者和播放语音距离较远的广播通信场景,这时麦克风一般设置在听者处,收录的广播语音经过了房间冲激响应以及长距离传播的能量衰减,所以需要估计听者处经过反射和衰减后的广播语音以及近端噪声,这类场景目前没有相关研究而且更具挑战性。

发明内容

针对广播场景下听者处广播语音和近端噪声的估计问题,以及语音可懂度增强算法在该场景下的应用问题,本发明实施例提供了一种广播通信场景的近端语音可懂度增强方法和系统。

第一方面,本发明提供了一种广播通信场景的近端语音可懂度增强方法,该方法包括:

获取原始广播的远端参考语音和麦克风采集的近端混合语音;所述近端混合语音包括混合了背景噪声的经过衰减后的远端参考语音;

对参考语音和混合语音进行特征提取,获得所述参考语音和混合语音的傅里叶频谱;在短傅里叶变换域,利用卡尔曼滤波器的时变特性,针对所述参考语音和混合语音的传播路径建立基于自回归信号模型的卡尔曼滤波器,将参考语音和混合语音的傅里叶频谱输入所述卡尔曼滤波器得到参考语音和混合语音最优的自回归系数;利用所述自回归系数进行估计获得近端的语音信号和噪声信号;

对所述语音信号和噪声信号进行特征提取,获得所述语音信号和噪声信号的傅里叶频谱;对语音信号的傅里叶频谱进行语音活动性检测,将语音信号和噪声信号的傅里叶频谱输入三分之一倍频程滤波器获得第一输出结果;利用可懂度增强算法对第一输出结果进行计算获得所述语音信号和噪声信号的频带能量,对所述频带能量进行频带间重分配获得所述语音信号的频带增益;

对原始广播语音进行特征提取,获得广播语音的傅里叶频谱;对广播语音的傅里叶频谱进行语音活动性检测并输入三分之一倍频程滤波器后获得第二输出结果;将第二输出结果与所述频带增益进行乘法运算得到可懂度增强后的语音频谱,对所述可懂度增强后的语音频谱进行傅里叶逆变换得到可懂度增强后的广播语音。

在一个可能的实施例中,对参考语音和混合语音进行特征提取,获得对应的傅里叶频谱,包括:

对所述参考语音和混合语音进行分帧得到对应的子音频;针对每一子音频进行加窗;对每一加窗后的子音频进行短时傅里叶变换得到所述参考语音和混合语音的傅里叶频谱。

在一个可能的实施例中,利用所述自回归系数进行估计获得近端的噪声信号和语音信号,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310049766.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top