[发明专利]联合因子分析方法及联合因子分析声纹认证方法无效

专利信息
申请号: 201010509879.4 申请日: 2010-10-15
公开(公告)号: CN102446505A 公开(公告)日: 2012-05-09
发明(设计)人: 李轶杰;黄伟 申请(专利权)人: 盛乐信息技术(上海)有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06
代理公司: 上海浦一知识产权代理有限公司 31211 代理人: 张骥
地址: 201203 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 联合 因子分析 方法 声纹 认证
【说明书】:

技术领域

发明涉及一种声纹认证方法,具体涉及一种联合因子分析方法。本发明还涉及一种联合因子分析声纹认证方法。

背景技术

在所有的识别任务中,训练环境和测试环境的差异是影响声纹认证系统性能的决定性因素。在复杂的现实环境下,声纹认证系统需要考虑诸多因素的影响,处理的任务也非常复杂,包括语种差异、信道差异、语音录制麦克风差异等等。

声纹认证系统的原理是声纹识别。声纹识别属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。

在声纹识别过程中,每段语音可分为两部分,一部分是说话人之间的变化,包括说话人声道、说话方式等,这部分变化对于一个人所说的多句话来说是相同的,这也是我们所感兴趣且希望提取出来建模的部分;另一部分是环境变化,主要可分为信道变化和个人特殊情况的变化,我们希望尽可能地抑制这部分变化的影响。

现有的声纹认证算法一般采用概率统计的方法,如何对信道差异进行补偿成为声纹认证系统的重中之重。而联合因子分析是目前国际上声纹认证算法中针对信道补偿最为有效的算法,也是近五年来三次国际最高水平的说话人评测(2006年、2008年、2010年)中最好的单系统。它假设说话人空间和信道空间是独立的,并可以分别用两个低维因子空间进行描述,从而通过估计信道因子而达到抑制信道影响的目的。

但是,现有的联合因子分析算法存在以下几个问题:

1、算法复杂,对训练数据要求很高;

2、关于说话人空间和信道空间独立的假设也不够严密,导致训练出来的模型无法模拟真实情况;

3、对复杂信道的处理不够细化,无法处理过于复杂的环境。

发明内容

本发明所要解决的技术问题是提供一种联合因子分析方法,它可以使声纹认证系统能够处理更为复杂的环境和数据。

为解决上述技术问题,本发明联合因子分析方法的技术解决方案为:

第一步,对原始语音进行特征提取;所述特征提取的参数包括表征语音信息的特征参数。

所述特征提取的参数可以是梅尔倒谱系数或线性预测倒谱系数。

第二步,根据所提取的数据,采用期望最大化算法,训练一个与说话人无关、与信道无关的通用背景模型;

第三步,采用本征语音算法,训练说话人本征空间,得到说话人的本征语音空间;

第四步,在说话人的本征语音空间的基础上,训练一个与说话人相关的对角矩阵模型,得到对角矩阵,完成说话人空间的训练;

第五步,在说话人空间的基础上,采用本征信道算法,以及各种信道类型的数据,分别训练多个信道空间,最后将所有信道空间进行拼接,得到一个总信道空间,从而完成整个模型训练过程。

所述信道空间是电话信道空间、麦克风信道空间、实际环境下的信道空间中的一种或多种。

本发明还提供一种联合因子分析声纹认证方法,其技术解决方案为:

采用联合因子分析方法,包括以下步骤:

第一步、注册阶段;

对注册的原始语音进行特征提取,根据联合因子分析方法得到说话人本征因子(由说话人的本征语音空间决定)、对角矩阵系数(由对角矩阵决定)、信道因子(由信道空间决定),并提取出其中的说话人本征因子和对角矩阵系数存储为相应的声纹模型,将该声纹模型作为说话人模型;

第二步、测试阶段;

对测试的原始语音进行特征提取,计算基于通用背景模型的总统计量;然后根据联合因子分析方法得到信道因子,计算信道因子相关的信道统计量;用总统计量减去信道统计量得到测试值,达到信道补偿的目的,将测试值与系统阈值对比,系统做出接受或拒绝的判决。

本发明可以达到的技术效果是:

本发明采用串行训练说话人空间,并行训练信道空间的联合因子分析方法,并将其应用于声纹认证系统。串行训练说话人空间的方式能够大大减弱两个低维空间训练过程中对于数据的依赖度,极大地降低系统的处理时间;而并行训练信道空间的方式使得声纹认证系统能够处理更为复杂的环境和数据,使声纹认证系统更加实用化和简单化。

本发明的联合因子分析方法采用了串行训练和并行训练相结合的方式,弱化了该算法不尽合理的原始基本假设,在效率易用性提高的同时,相对性能也可以提升15%。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盛乐信息技术(上海)有限公司,未经盛乐信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010509879.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top