[发明专利]模型训练方法、回声消除方法、系统、设备及存储介质在审
申请号: | 202210176223.8 | 申请日: | 2022-02-25 |
公开(公告)号: | CN114530160A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 杜诗宣;任君;罗超;邹宇 | 申请(专利权)人: | 携程旅游信息技术(上海)有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L17/04;G10L17/18;H04M9/08 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 罗朗;马涛 |
地址: | 201203 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 回声 消除 系统 设备 存储 介质 | ||
本发明公开了一种模型训练方法、回声消除方法、系统、设备及存储介质,包括:获取历史训练数据,该历史训练数据包括近端信号和远端信号以及近端语音信号,该近端信号为包含近端噪音信号、近端语音信号以及回声信号的混合信号;基于历史训练数据训练神经网络模型,以得到回声消除模型;该回声消除模型以近端信号和远端信号为输入,以消除回声后得到的近端语音信号为输出。本发明通过获取近端信号和远端信号以及近端语音信号的历史训练数据,基于历史训练数据训练神经网络模型,以得到回声消除模型,实现了利用回声消除模型对输入的近端信号和远端信号进行回声消除,进而得到消除回声后的近端语音信号,提高了回声消除的准确性以及回声消除的效率。
技术领域
本发明涉及回声消除技术领域,特别涉及一种模型训练方法、回声消除方法、系统、设备及存储介质。
背景技术
声学回声(Acoustic Echo)是一种在语音通信中的常见问题,以呼叫中心的场景为例,当客人和客服通话时,客服的声音被客人的麦克风接受,导致客服在耳麦中听到了自己被延迟的声音。客人声道的语音混杂了客服的说话内容,导致依赖该音频的语音转文字和声纹识别任务受到严重干扰。
目前传统的基于滤波器的回声消除方法,是将滤波后的远端信号视为估计的回声,再从近端信号中减去估计的回声,最终得到消除回声后的近端语音。而这种方法虽然可以消除线性回声,但依赖于时延估计、端点检测等模块,如果时延估计或端点检测的结构不准确,不仅会导致回声的估计错误,且在近端信号中减去估计回声时因错误导致更糟糕的结果。并且这种模拟回声通路的滤波方法,不适合消除非线性回声,需要针对残留回声进行再一次的消除。
发明内容
本发明要解决的技术问题是为了克服现有技术中现有的回声消除方法存在回声消除不精准、消除效率低的缺陷,提供一种模型训练方法、回声消除方法、系统、设备及存储介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明第一方面提供了一种模型训练方法,所述模型训练方法包括:
获取历史训练数据,所述历史训练数据包括近端信号和远端信号以及近端语音信号,所述近端信号为包含近端噪音信号、近端语音信号以及回声信号的混合信号;
基于所述历史训练数据训练神经网络模型,以得到回声消除模型;
所述回声消除模型以所述近端信号和所述远端信号为输入,以消除回声后得到的近端语音信号为输出。
较佳地,所述获取历史训练数据的步骤之后,所述模型训练方法还包括:
对所述历史训练数据进行静音检测去除处理,以得到去除静音后的历史训练数据。
较佳地,所述模型训练方法还包括:
从所述历史训练数据中获取测试数据;
利用所述测试数据测试所述回声消除模型的预测结果,以得到所述测试数据对应的预测近端语音信号;
获取所述测试数据对应的真实近端语音信号;
基于所述预测近端语音信号与所述真实近端语音信号计算所述回声消除模型的损失函数值;
基于所述损失函数值优化所述回声消除模型。
本发明第二方面提供了一种模型训练系统,所述模型训练系统包括:
第一获取模块,用于获取历史训练数据,所述历史训练数据包括近端信号和远端信号以及近端语音信号,所述近端信号为包含近端噪音信号、近端语音信号以及回声信号的混合信号;
训练模块,用于基于所述历史训练数据训练神经网络模型,以得到回声消除模型;
所述回声消除模型以所述近端信号和所述远端信号为输入,以消除回声后得到的近端语音信号为输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于携程旅游信息技术(上海)有限公司,未经携程旅游信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210176223.8/2.html,转载请声明来源钻瓜专利网。