[发明专利]一种语音通话的处理方法以及相关装置有效
申请号: | 202010014701.6 | 申请日: | 2020-01-07 |
公开(公告)号: | CN111179957B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 吴伟;余涛;方雪飞 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0232;G10L25/03;G10L25/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 通话 处理 方法 以及 相关 装置 | ||
本申请公开了一种语音通话的处理方法以及相关装置,通过采集通话时间段内的语音信息;然后将所述语音信息输入神经网络模型,以获取用于指示所述语音信息是有效语音的概率的第一掩模值,并根据所述第一掩模值确定所述语音信息的信干比;进而根据所述信干比对所述语音信息进行处理,以得到用于输出的语音。从而实现了基于神经网络消除回声的过程,可以对多种场景下的回声进行消除;且由于神经网络中特征训练集的广泛性,保证了不同场景下回声消除过程的准确性,提高了用户体验。
技术领域
本申请涉及计算机技术领域,尤其涉及一种语音通话的处理方法以及相关装置。
背景技术
随着移动终端相关技术的发展,越来越多的智能设备出现在人们的生活中,其中,通过智能设备进行进行语音通话尤为突出,然而由于通话过程中麦克风也会采集本端智能设备扬声器发出的声音或对端用户发出的声音,造成回声进而影响语音的准确性。
一般,采用线性滤波器处理回声的方法进行回声消除,即对语音过程中每个频点进行固定滤波器系数的处理,以减小回声的影响。
但是,基于线性处理对硬件采集的语音质量要求较高,若硬件语音采集的质量不佳会直接影响回声消除能力的强度,故上述方法适用范围有限,且对于一般的硬件设备容易漏掉回声残余或对有效的语音产生缺失,影响回声消除的准确性,降低了用户体验。
发明内容
有鉴于此,本申请提供一种语音通话处理的方法,可以有效消除语音通话过程中的回声,提高语音通话的准确性。
本申请第一方面提供一种语音通话处理的方法,可以应用于包含语音通话功能的系统或程序中,具体包括:采集通话时间段内的语音信息;
将所述语音信息输入神经网络模型,以获取第一掩模值,所述神经网络模型基于多个参考信号与多个采集信号进行特征训练所得,所述参考信号用于指示通话过程中的干扰因素,所述采集信号用于指示通话过程中的有效语音,所述第一掩模值用于指示所述语音信息是所述有效语音的概率;
根据所述第一掩模值确定所述语音信息的信干比;
根据所述信干比对所述语音信息进行处理,以得到用于输出的语音。
可选的,在本申请一些可能的实现方式中,所述语音信息包括至少两个帧,针对所述至少两个帧中的第一帧,所述方法还包括:
获取所述第一帧的延时信息;
确定与所述第一帧的延时信息对应第一计算公式;
所述根据所述第一掩模值确定所述语音信息的信干比,包括:
将所述第一掩模值代入到所述第一计算公式,以确定所述第一帧的幅度谱;
根据所述至少两个帧中每个第一帧的幅度谱确定所述语音信息的信干比。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
获取当前时刻的参考信号与当前时刻的采集信号,并确定相关度;
所述将所述第一掩模值代入到所述第一计算公式,以确定所述第一帧的幅度谱,包括:
根据所述第一帧的延时信息确定延时状态,所述延时状态包括延时稳定和延时波动;
根据所述相关度确定不同延时状态下所述第一帧对应的所述第一计算公式。
可选的,在本申请一些可能的实现方式中,根据所述第一帧的延时信息确定延时状态,包括:
若所述第一帧与相邻帧的延时差值小于延时阈值,则确定所述多个帧的延时状态为延时稳定;
若所述第一帧与所述相邻帧的延时差值大于或等于所述延时阈值,则确定所述多个帧的延时状态为延时波动。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010014701.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:核电站油浸式变压器的带电检测系统
- 下一篇:光伏控制方法和光伏供电装置、系统