[发明专利]基于DTW和GMM模型的多维特征参数声纹识别方法有效
申请号: | 201810515482.2 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108922541B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 邓立新;李秀 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/02;G10L17/06;G10L25/78;G10L25/87;G10L25/24;G10L25/93 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 dtw gmm 模型 多维 特征 参数 声纹 识别 方法 | ||
1.一种基于DTW和GMM模型的多维特征参数声纹识别方法,其特征在于,包括如下步骤:
S1、语音信号采样,对训练语音和来自说话人的待识别语音进行采样收集;
S2、语音信号预处理,将所采样的训练语音和待识别语音进行预处理;
S3、语音信号特征参数提取,对训练语音及待识别语音进行特征参数提取,分别提取出梅尔倒谱系数和基音周期;
S4、语音信号模型训练,对所采样的训练语音通过最大似然概率估计法得到高斯混合模型的均值、协方差矩阵和加权系数,记录得到的数据,保存相对应的高斯混合模型;
S5、待识别语音信号匹配识别,先运用动态时间规整法匹配识别待识别语音,再运用高斯混合模型来匹配识别待识别语音,得出识别结果,包括如下步骤:
S51、动态时间规整法匹配识别,以从待识别语音中提取出的基音周期作为x轴、训练语音的基音周期作为y轴,将规整函数局限在一个平行四边形内,将平行四边形其中一条边的斜率设定为2、另一条边的斜率被设定为0.5,分别将训练语音和待识别语音的头部相对齐、尾部相对齐,以点(1,1)为起点开始行进,所经历的路线必须为0或1或2,最终到达终点,计算得出行进距离,将行进距离数据进行从小到大排序,筛选出位于前30%的训练语音作为训练模板;
S52、高斯混合模型匹配识别,将待识别语音中每一帧的梅尔倒谱系数分别与训练模板进行匹配,通过最大似然概率法得到高斯混合模型的识别结果,最后结合匹配结果得出最终识别结果。
2.根据权利要求1所述的基于DTW和GMM模型的多维特征参数声纹识别方法,其特征在于,所述S2包括如下步骤:
S21、对训练语音和待识别语音进行预加重,预加重表达式为,
S(n)=S1(n)-a*S1(n)
其中,S1(n)表示语音的时域的信号,a表示预加重系数;
S22、对训练语音和待识别语音进行分帧,选择帧长为25ms,帧移为10ms,采样点个数为25;
S23、对训练语音和待识别语音进行加窗,将分得的每一帧都乘上窗函数,窗函数为海明窗,窗函数表达式为,
其中,N为分帧后的取样个数,a’表示海明窗系数;
S24、对训练语音和待识别语音进行端点检测,去除语音信号中的无声部分,采用双门限法分别计算出语音信号的短时平均能量和短时平均过零率,通过设置阈值来去除无声部分,
短时平均能量公式为
其中,Ei表示第i帧的短时能量,s(n)表示语音的时域信号,w(n)表示加窗函数,h(n)表示单位冲激响应,
短时平均过零率公式如下:
其中,Zi表示第i帧的短时过零率,w(n)表示加窗函数。
3.根据权利要求1所述的基于DTW和GMM模型的多维特征参数声纹识别方法,其特征在于,所述S3包括如下步骤:
S31、对训练语音及待识别语音进行梅尔倒谱系数提取;
S32、对训练语音及待识别语音进行基音周期提取。
4.根据权利要求3所述的基于DTW和GMM模型的多维特征参数声纹识别方法,其特征在于,所述S31包括如下步骤:
S311、快速傅里叶变换,快速傅里叶变换的公式为,
其中,Si为第i个帧的向量,N为分帧后的取样个数;
S312、三角带通滤波,所使用的三角滤波器函数表达式为,
其中,f[i]为第i个三角带通滤波的频率中心值,Hi(k)为第i个三角带通滤波的加权系数;
S313、对数变化,将三角带通滤波器处理得到的语音信号进行对数运算;
S314、离散余弦变换,离散余弦变换的表达式为,
其中,Si表示为第i个帧向量在频域的成分表,N表示分帧后的取样个数,Ci(n)表示第i个帧的梅尔倒谱系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810515482.2/1.html,转载请声明来源钻瓜专利网。