[发明专利]用于说话人识别的多背景模型建立方法有效

专利信息
申请号: 201010118149.1 申请日: 2010-03-04
公开(公告)号: CN101833951A 公开(公告)日: 2010-09-15
发明(设计)人: 张卫强;刘加 申请(专利权)人: 清华大学
主分类号: G10L15/06 分类号: G10L15/06;G10L15/02
代理公司: 北京众合诚成知识产权代理有限公司 11246 代理人: 朱琨
地址: 100084 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 说话 识别 背景 模型 建立 方法
【权利要求书】:

1.用于说话人识别的多背景模型建立方法,其特征在于,所述方法是在数字集成电路芯片中依次按以下步骤实现的:

步骤(1):采用Baum-Welch算法,用训练通用背景模型UBM的所有数据训练一个高斯混合模型GMMΛ0

步骤(2):求取每段语音的声道长度弯折系数,具体做法为:

步骤(2.1):声道长度弯折系数α从0.88以步长0.02变化到1.12,对信号频谱进行“弯折”,设弯折前后的频率为f,fα,频谱的低通和高通截止频率为fl,fu,则弯折公式为

fα=f+2(fu-fl)πarctan((1-α)sinθ1-(1-α)cosθ),]]>

其中θ=f-flfu-flπ;]]>

步骤(2.2):对步骤(2.1)中每个弯折系数对应的频谱求取Mel频率倒谱系数MFCC特征搜索使所述特征对模型Λ0的似然度最大的弯折系数:

α*即为该段语音的声道长度弯折系数;

步骤(3):将训练UBM的数据按声道长度弯折系数分成8份,其中α*=0.88的为第1份,α*=0.90的为第2份,α*=0.92的为第3份,α*=0.94的为第4份,α*=0.96,0.98的为第5份,α*=1.00,1.02的为第6份,α*=1.04,1.06的为第7份,α*=1.08,1.10,1.12的为第8份,这样划分是由于考虑各份中数据量的平衡,采用所述Baum-Welch算法用每份数据训练一个UBM模型;

步骤(4):用目标说话人的训练语音提取所述MFCC特征,并对8个UBM模型分别进行最大后验概率MAP自适应,得到8个GMM模型,具体自适应方法为:

步骤(4.1):假设其中一个UBM的参数为wm、μm和σm2分别表示权重、均值和方差,其数值由步骤(3)中的Baum-Welch算法得到,权重满足下标m表示高斯分量标号,共含M个高斯分量,假设训练语音共含T帧特征,其中第t帧特征为ot,则ot属于第m个高斯分量的后验概率为:

其中(·)表示高斯分布的概率密度,对t=1,...,T,m=1,...,M进行循环,计算每帧特征属于每个高斯分量的后验概率;

步骤(4.2):将后验概率以及后验概率与特征的乘积对所有帧进行累加,计算零阶和一阶统计量:

nm=Σt=1Tγm(t),]]>

对m=1,...,M进行循环,计算每个高斯分量的零阶和一阶统计量;

步骤(4.3):对一阶统计量和UBM的均值进行线性插值,得到自适应后的GMM模型的均值:

其中插值系数为λm=nm/(nm+r),r为常数,取值为16,对m=1,...,M进行循环,计算GMM模型的每个高斯分量的均值,其权重和方差直接采用UBM的对应的权重和方差;

步骤(5):对于测试语音提取MFCC特征,然后分别用8组GMM和UBM模型求取对数似然比分数,从中选取最小的一个作为分数输出,具体方法为:

步骤(5.1):假设测试语音共含Te帧特征,则一组GMM和UBM模型的对数似然比分数为:

步骤(5.2):按步骤(5.1)所述求取8组的对数似然比分数,从中选取最小的一个作为输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010118149.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top