[发明专利]一种语音增强方法和装置在审
申请号: | 201910774538.0 | 申请日: | 2019-08-21 |
公开(公告)号: | CN112420063A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 王保辉;李伟;李晓建;胡伟湘 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0272;G10L17/22;G10L17/14;G10L17/04 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 增强 方法 装置 | ||
本申请实施例公开了一种语音增强方法和装置,涉及通信技术领域,解决了现有技术在声音环境较为复杂的场景下,无法对环境做到自适应,用户智能交互的体验较差的问题,该语音增强方法通过采用人工智能技术,可以提升用户智能交互体验。具体方案为:电子设备采集第一声音,第一声音包括第二声音和背景声音中的至少一项;电子设备识别第一声音;当第一声音存在第二声音时,电子设备对第二声音进行声音分析,得到第三声音;电子设备处理第三声音。
技术领域
本申请实施例涉及通信技术领域,尤其涉及一种语音增强方法和装置。
背景技术
目前,传统的语音增强算法对不同环境下的所有输入声音进行同一套语音增强算法,不论输入任何声音都进行同样的增强。例如,以智能音箱的接收的声音包括人声、电视声、狗叫声、水流声等多种声音的情况下,采用现有的语音增强算法将对所有声音进行同样的增强,这将导致智能音箱可能无法准确的获知用户命令,造成智能音箱语音交互不输出,或者语音交互输出不出准确等问题,使得用户智能交互的体验较差。因此,现有的语音增强算法在声音环境较为复杂的场景下,无法对环境做到自适应,用户智能交互的体验较差。
发明内容
本申请实施例提供一种语音增强方法和装置,能够在声音环境较为复杂的场景下,准确的从复杂的声音环境中捕捉到目标用户的语音,提升了用户智能交互的体验。
本申请实施例的第一方面,提供一种语音增强方法,该方法包括:电子设备采集第一声音,该第一声音包括第二声音和背景声音中的至少一项;该电子设备识别该第一声音;当该第一声音存在上述第二声音时,该电子设备对该第二声音进行声音分析,得到第三声音;该电子设备处理该第三声音。基于本方案,通过识别采集到的第一声音,并在第一声音中存在第二声音时,从第一声音中分离出第二声音(人声),并从第二声音中提取出第三声音(用户语音交互命令),从而对用户语音交互命令进行处理,获得的语音交互输出较为准确,因此能够准确的完成语音交互,提升了用户智能交互的体验。而且本申请在从复杂的声音环境中提取用户语音交互命令时,通过对声音进行识别和分析,并结合声音的属性信息,得到用户语音交互命令(第三声音),因此,该语音增强方法并不是对所有输入的声音进行同样的增强,而是结合当前采集的声音的属性信息进行针对性增强,因此能够适应复杂的声音环境,提升了复杂声音环境下用户的智能交互体验。
结合第一方面,在一种可能的实现方式中,上述电子设备识别第一声音,包括:上述电子设备根据声音事件识别模型,对该第一声音进行声音事件识别,获取该第一声音的声音类别信息。基于本方案,通过识别第一声音,可以获取第一声音的声音类别信息,从而能够根据该第一声音的声音类别信息,从第一声音中提取出第二声音。
结合第一方面或第一方面的任一可能的实现方式,在另一种可能的实现方式中,上述电子设备对上述第二声音进行声音分析,得到第三声音,包括:上述电子设备根据上述第一声音的声音类别信息,从上述第一声音中分离出上述第二声音;上述电子设备分析上述第二声音的声音属性信息;其中,该声音属性信息包括:声音方位信息、声纹信息、声音时间信息、声音分贝信息中的一种或多种;上述电子设备根据该第二声音的声音属性信息,得到第三声音。基于本方案,通过从第一声音中分离出第二声音,并对第二声音进行属性分析,能够根据第二声音的属性信息从多个人声中提取出声音,得到干净的用户语音交互命令,实现针对性增强。
结合第一方面或第一方面的任一可能的实现方式,在另一种可能的实现方式中,上述第三声音的声纹信息与已注册用户的声纹信息匹配。基于本方案,可以通过声纹信息,将与已注册用户的声纹信息匹配的声音确定为第三声音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910774538.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种持久耐用型三相异步电机
- 下一篇:纳米材料及其制备方法和印刷显示材料