[发明专利]一种混合语音信号的处理方法及装置在审
申请号: | 202010877506.6 | 申请日: | 2020-08-27 |
公开(公告)号: | CN111968668A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 张誉怀 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L25/18;G10L25/21;G10L25/24;G10L25/51 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张全文 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 混合 语音 信号 处理 方法 装置 | ||
本申请适用于人工智能中的语音处理的技术领域,提供了一种混合语音信号的处理方法及系统,所述处理方法包括:获取混合语音信号对应的多个第一听觉片段;在多个所述第一听觉片段中,选择一个符合预设条件的所述第一听觉片段,作为核心片段;根据所述核心片段的基音周期和每个所述第一听觉片段的片段参数,将核心片段与除去所述核心片段的剩余第一听觉片段匹配,得到目标声源的目标听觉片段,所述片段参数包括音色和梅尔频率倒谱系数。通过上述方式实现,在混合语音信号中,分别根据目标声源的基音周期以及片段参数,匹配目标声源的目标听觉片段。提高了匹配目标听觉片段的精准度。
技术领域
本申请属于人工智能中的语音处理的技术领域,尤其涉及一种混合语音信号的处理方法及装置。
背景技术
人的听觉系统能够在噪声环境中跟踪自己感兴趣的语音信号,即使多种声音同时存在,也能听取所需要的内容。听觉场景分析正是在这一听觉生理现象上提出的理论。听觉场景分析技术利用计算机技术通过对人类心理过程及听觉生理机能的模拟,最终使计算机具备像人耳一样处理声音的能力。听觉场景分析技术具体通过听觉外围分析、语音分离特征提取、听觉分段、语音重组以及语音合成,实现混合语音分离的功能。
但是,在传统的听觉场景分析技术中,针对多人混合语音分离的效果往往较差。其原因在于:在语音重组时,多个听觉片段(听觉片段是指由多个时频单元组成的片段)仅仅依据能量特性进行组合,以分离出多个听觉流(听觉流是指由多个听觉片段组成而成的声音信息)。由于语音信号中,不仅包括目标用户发出的语音信息,也包括其他用户发出的语音信息或环境噪音。若仅仅通过能量特征将多个听觉片段进行组合,容易导致目标听觉流中包含非目标用户对应的听觉片段。因此传统的听觉场景分析技术,匹配目标听觉片段的精准度较低。
发明内容
有鉴于此,本申请实施例提供了一种混合语音信号的处理方法及装置,可以解决由于语音信号中,不仅包括目标用户发出的语音信息,也包括其他用户发出的语音信息或环境噪音。若仅仅通过能量特征将多个听觉片段进行组合。容易导致目标听觉流中包含非目标用户对应的听觉片段。因此传统的听觉场景分析技术,匹配目标听觉片段的精准度较低的技术问题。
本申请实施例的第一方面提供了一种混合语音信号的处理方法,所述处理方法包括:
获取混合语音信号对应的多个第一听觉片段,其中,所述第一听觉片段是指由多个时频单元组成的片段;
在多个所述第一听觉片段中,选择一个符合预设条件的所述第一听觉片段,作为核心片段;
根据所述核心片段的基音周期和每个所述第一听觉片段的片段参数,将核心片段与除去所述核心片段的剩余第一听觉片段匹配,得到目标声源的目标听觉片段,所述片段参数包括音色和梅尔频率倒谱系数。
本申请实施例的第二方面提供了一种混合语音信号的处理装置,所述处理装置包括:
获取单元,用于获取混合语音信号对应的多个第一听觉片段,其中,所述第一听觉片段是指由多个时频单元组成的片段;
判断单元,用于在多个所述第一听觉片段中,选择一个符合预设条件的所述第一听觉片段,作为核心片段;
匹配单元,用于根据所述核心片段的基音周期和每个所述第一听觉片段的片段参数,将核心片段与除去所述核心片段的剩余第一听觉片段匹配,得到目标声源的目标听觉片段,所述片段参数包括音色和梅尔频率倒谱系数。
本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010877506.6/2.html,转载请声明来源钻瓜专利网。