[发明专利]一种多人语音混合中目标说话人估计方法及系统有效
申请号: | 201810610015.8 | 申请日: | 2018-06-13 |
公开(公告)号: | CN108766459B | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 刘宏哲;张启坤 | 申请(专利权)人: | 北京联合大学 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0308;G10L25/03;G10L25/21;G10L25/24 |
代理公司: | 北京驰纳智财知识产权代理事务所(普通合伙) 11367 | 代理人: | 谢亮 |
地址: | 100101 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种多人语音混合中目标说话人估计方法及系统,其中方法包括使用麦克风阵列采集语音信号得到混合信号x,还包括以下步骤:使用FastICA算法进行多人混合语音分离,得到N个分离语音y;提取多个语音特征;进行语音特征归一化;归一化的语音特征加权融合;使用高斯混合模型进行加权参数优化;使用期望最大化算法EM算法进行高斯混合模型估计;输出目标语音。本发明提出的一种多人语音混合中目标说话人估计方法及系统,解决了多人场景下语音分离的不确定性问题和语音识别率低的问题,对多人混合语音中目标说话人进行概率估计,以便增强目标说话人语音的可懂度和识别率。 | ||
搜索关键词: | 一种 人语 混合 目标 说话 估计 方法 系统 | ||
【主权项】:
1.一种多人语音混合中目标说话人估计方法,包括使用麦克风阵列采集语音信号得到混合信号x,其特征在于,还包括以下步骤:步骤1:使用FastICA算法进行多人混合语音分离,得到N个分离语音y;步骤2:提取多个语音特征;步骤3:进行语音特征归一化;步骤4:归一化的语音特征加权融合;步骤5:使用高斯混合模型进行加权参数优化;步骤6:使用期望最大化算法EM算法进行高斯混合模型估计;步骤7:输出目标语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京联合大学,未经北京联合大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810610015.8/,转载请声明来源钻瓜专利网。