[发明专利]一种多人语音混合中目标说话人估计方法及系统有效
申请号: | 201810610015.8 | 申请日: | 2018-06-13 |
公开(公告)号: | CN108766459B | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 刘宏哲;张启坤 | 申请(专利权)人: | 北京联合大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L25/03;G10L25/21;G10L25/24 |
代理公司: | 北京驰纳智财知识产权代理事务所(普通合伙) 11367 | 代理人: | 谢亮 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人语 混合 目标 说话 估计 方法 系统 | ||
本发明提供一种多人语音混合中目标说话人估计方法及系统,其中方法包括使用麦克风阵列采集语音信号得到混合信号x,还包括以下步骤:使用FastICA算法进行多人混合语音分离,得到N个分离语音y;提取多个语音特征;进行语音特征归一化;归一化的语音特征加权融合;使用高斯混合模型进行加权参数优化;使用期望最大化算法EM算法进行高斯混合模型估计;输出目标语音。本发明提出的一种多人语音混合中目标说话人估计方法及系统,解决了多人场景下语音分离的不确定性问题和语音识别率低的问题,对多人混合语音中目标说话人进行概率估计,以便增强目标说话人语音的可懂度和识别率。
技术领域
本发明涉及计算机听觉与人工智能的技术领域,特别是一种多人语音混合中目标说话人估计方法及系统。
背景技术
随着计算机和人工智能技术的快速发展,智能语音技术在人机交互中被广泛应用。如微信、QQ等移动通讯方式都有很多关于语音的应用。在理想的安静条件下,语音识别转文本、声纹识别解锁等智能语音技术给我们带来很多便利。但是在多人说话场景下,识别效果就大大降低,这就需要对多人混合语音进行目标说话人估计,以提高目标说话人语音的可懂度和识别率。针对背景噪声、其他人干扰语音的影响,最常见的方法就是进行语音分离或语音增强处理。然而语音的混合会导致语音分离得到的分离语音具有不确定性。具体来说,语音混合时我们不知道原始语音信号的状态,也不知道语音混合的方式,所以导致分离语音具有不确定性,也就是说,即使分离完也不知道分离的语音是属于谁的语音,不知道哪个语音是目标说话人的语音。所以,必须进行目标说话人估计,对多人混合语音分离得到的语音进行处理,概率估计出哪个分离语音是属于目标说话人的语音,以此提高语音的分离性能、可懂度、识别率。
公开号为CN103811020A的发明专利公开了一种智能语音处理方法,本发明通过建立对话人声音模型库,实现在多人语音环境下智能识别多个对话人的身份同时分离混合语音得到每个对话人的独立语音,根据用户需求为用户放大要听取的对话人的语音同时消除非用户要求的对话人的语音。该申请存在以下问题:(1)模型训练实时性不足。需要先建立模型库,再进行说话人身份识别,再分离混合语音;(2)建立对话人声音模型库,需要大量的语音样本数据。如果样本数据太多,训练会更耗时。如果样本数据太少,训练的模型适用性更差。(3)模型的泛化性、可移植性存在问题。因为不同背景噪声、不同的其他干扰人的语音训练的模型不同,不一定适用与其他的背景噪声环境和其他不同干扰说话人的声音环境。
发明内容
为了解决上述的技术问题,本发明提出的一种多人语音混合中目标说话人估计方法及系统,不需要建立模型库,也不需要样本数据进行训练,实时性更好,不会因为背景环境或者干扰说话人改变而导致分离性能下降,适用性更强,解决了多人场景下混合语音分离的不确定性问题和语音识别率低的问题,对多人混合语音中目标说话人进行概率估计,以便增强目标说话人语音的可懂度和识别率。
本发明的第一目的是提供一种多人语音混合中目标说话人估计方法,包括通用麦克风阵列采集语音信号得到混合信号x,还包括以下步骤:
步骤1:使用FastICA算法进行多人混合语音分离,得到N个分离语音;
步骤2:提取多个语音特征;
步骤3:进行语音特征归一化;
步骤4:归一化的语音特征加权融合;
步骤5:使用高斯混合模型进行加权参数优化;
步骤6:使用期望最大化算法EM算法进行高斯混合模型估计;
步骤7:输出目标语音。
优选的是,所述步骤1包括以下子步骤:
步骤11:对混合观测信号x中心化去均值,
其中,i=1…..n,n为实系数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京联合大学,未经北京联合大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810610015.8/2.html,转载请声明来源钻瓜专利网。