[发明专利]声音处理方法和装置有效
申请号: | 202110694724.0 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113516995B | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 王心恬;马路;杨嵩 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;H04M1/20 |
代理公司: | 北京北汇律师事务所 11711 | 代理人: | 李英杰 |
地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 处理 方法 装置 | ||
本公开提供一种声音处理方法和装置,属于信号处理领域。所述方法包括:获取待处理的混合声音数据,将混合声音数据切分为多个混合音频帧,其中,混合声音数据包括目标声音数据和干扰声音数据;获取混合声音数据对应的参考声音数据,将参考声音数据切分为多个参考音频帧;调用回声消除模型,对于混合声音数据的一个混合音频帧,根据对应的参考声音数据的第一预设数目个参考音频帧,对混合音频帧进行回声消除处理,得到混合音频帧中的子目标声音数据,其中,第一预设数目个参考音频帧为混合音频帧对应的参考音频帧的当前帧及其之前接收到的音频帧;根据得到的混合声音数据的每个混合音频帧的子目标声音数据,确定混合声音数据中的目标声音数据。采用本公开,可以提高声音处理的效率。
技术领域
本公开涉及信号处理领域,尤其涉及一种声音处理方法和装置。
背景技术
在会议或者手机免提等实际场景中,可以将采集声音数据的终端侧称为近端,相对应的一侧即为远端。近端可以接收到远端传输的声音数据,并通过扬声器发出相应的声音。
如图1所示的场景示意图,当用户处在一个封闭场所时,扬声器发出的声音可能经过空间的反射形成回声,与当前扬声器发出的声音共同形成干扰。也即是说,近端的麦克风可能采集到当前说话人的目标声音数据以及扬声器产生的干扰声音数据,使得远端的用户可能听到多种声音,大大降低通话质量。
因此,亟需一种声音处理方法对干扰声音数据进行消除。
发明内容
为了解决现有技术的问题,本公开实施例提供了一种声音处理方法和装置。技术方案如下:
根据本公开的一方面,提供了一种声音处理方法,所述方法包括:
获取待处理的混合声音数据,将所述混合声音数据切分为多个混合音频帧,其中,所述混合声音数据包括目标声音数据和干扰声音数据;
获取所述混合声音数据对应的参考声音数据,将所述参考声音数据切分为多个参考音频帧;
调用回声消除模型,对于所述混合声音数据的一个混合音频帧,根据对应的所述参考声音数据的第一预设数目个参考音频帧,对所述混合音频帧进行回声消除处理,得到所述混合音频帧中的子目标声音数据,其中,第一预设数目个参考音频帧为混合音频帧对应的参考音频帧的当前帧及其之前接收到的音频帧;
根据得到的所述混合声音数据的每个混合音频帧的子目标声音数据,确定所述混合声音数据中的目标声音数据。
根据本公开的另一方面,提供了一种声音处理装置,所述装置包括:
第一获取模块,用于获取待处理的混合声音数据,将所述混合声音数据切分为多个混合音频帧,其中,所述混合声音数据包括目标声音数据和干扰声音数据;
第二获取模块,用于获取所述混合声音数据对应的参考声音数据,将所述参考声音数据切分为多个参考音频帧;
调用模块,用于调用回声消除模型,对于所述混合声音数据的一个混合音频帧,根据对应的所述参考声音数据的第一预设数目个参考音频帧,对所述混合音频帧进行回声消除处理,得到所述混合音频帧中的子目标声音数据,其中,所述第一预设数目个参考音频帧为所述混合音频帧对应的参考音频帧的当前帧及其之前接收到的音频帧;
确定模块,用于根据得到的所述混合声音数据的每个混合音频帧的子目标声音数据,确定所述混合声音数据中的目标声音数据。
根据本公开的另一方面,提供了一种电子设备,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上述声音处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110694724.0/2.html,转载请声明来源钻瓜专利网。