[发明专利]语音获取方法、装置、电子设备及存储介质有效
申请号: | 202111496026.6 | 申请日: | 2021-12-09 |
公开(公告)号: | CN113903355B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 智鹏鹏;陈昌滨 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0208 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 获取 方法 装置 电子设备 存储 介质 | ||
本公开提供一种语音获取方法、装置、电子设备及存储介质,该语音获取方法包括:根据混合信号的幅度信息执行分离处理,获得语音分离掩膜;根据所述语音分离掩膜、所述混合信号的所述幅度信息和相位信息,获得语音耦合数据;针对所述语音耦合数据执行增强处理,获得语音增强掩膜;以及根据所述语音增强掩膜和所述语音分离掩膜,获得语音信号。据此,可以提高语音获取效果。
技术领域
本公开涉及音频数据处理技术领域,尤其涉及一种语音获取方法、装置、电子设备和存储介质。
背景技术
语音增强是指利用音频信号处理技术及各种算法提高失真语音信号的可懂度或整体感知质量,从而进一步在语音识别、语音通话、听力辅助以及声纹识别等场景中改善应用效果。
以教学应用场景为例,在很多情况下,由于无法保证录音环境的绝对安静,导致所获取的教学音频不可避免地会受到一些环境噪声和背景音的干扰,并导致了教学质量的降低,因此,需要针对教学音频进行增强处理,以去除背景音和噪音。
然而,由于音频数据中的背景音通常是非平稳的信号,并且具有谐波结构,因此,会给语音分离和增强处理作业带来较大困难。
有鉴于此,亟需一种可提供更佳语音分离效果的语音获取技术方案。
发明内容
有鉴于此,本公开实施例所解决的技术问题之一在于提供一种可提高语音获取质量的语音获取方法、装置、电子设备及存储介质,以至少部分的解决上述问题。
根据本公开的第一方面,提供了一种语音获取方法,其包括:根据混合信号的幅度信息执行分离处理,获得语音分离掩膜;根据所述语音分离掩膜、所述混合信号的所述幅度信息和相位信息,获得语音耦合数据;针对所述语音耦合数据执行增强处理,获得语音增强掩膜;以及根据所述语音增强掩膜和所述语音分离掩膜,获得语音信号。
根据本公开的第二方面,提供了一种语音获取装置,其包括:语音分离模块,用于根据混合信号的幅度信息执行分离处理,获得语音分离掩膜;耦合模块,用于根据所述语音分离掩膜、所述混合信号的所述幅度信息和相位信息,获得语音耦合数据;语音增强模块,用于针对所述语音耦合数据执行增强处理,获得语音增强掩膜;转换模块,用于根据所述语音增强掩膜和所述语音分离掩膜,获得语音信号。
根据本公开的第三方面,提供了一种电子设备,包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行如第一方面所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如第一方面所述的方法。
综上所述,本公开各实施例提供的语音获取方法、装置、电子设备及存储介质,针对混合信号执行分离处理,以分离出混合信号中的语音部分,再执行语音增强处理,以针对所分离出的语音部分进行降噪处理,借以提高语音信号的获取效果。
附图说明
后文将参照附图以示例性而非限制性的方式详细描述本公开实施例的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比值绘制的。附图中:
图1示出了本公开第一实施例的语音获取方法的流程示意图。
图2示出了本公开第二实施例的语音获取方法的流程示意图。
图3示出了本公开第二实施例的语音分离模型的结构示意图。
图4示出了本公开第三实施例的语音获取方法的流程示意图。
图5示出了本公开第四实施例的语音获取方法的流程示意图。
图6示出了本公开第四实施例的复数语音增强模型的结构示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111496026.6/2.html,转载请声明来源钻瓜专利网。