[发明专利]基于DTW和GMM模型的多维特征参数声纹识别方法有效
申请号: | 201810515482.2 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108922541B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 邓立新;李秀 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/02;G10L17/06;G10L25/78;G10L25/87;G10L25/24;G10L25/93 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于DTW和GMM模型的多维特征参数声纹识别方法,包括如下步骤:S1、语音信号采样,S2、语音信号预处理,S3、语音信号特征参数提取,S4、语音信号模型训练,S5、待识别语音信号匹配识别。本发明通过在MFCC的基础上引入基音周期的方式,构造出经过改进的多维特征参数,不仅有效地提升了声纹识别的识别率,而且也避免了现有技术中因单独使用MFCC参数所造成的易被模仿的缺陷。同时,本发明采用了两步匹配识别算法,第一步运用DTW法部分匹配基音周期这个特征参数,进行初步识别,筛选掉数据库中不匹配的模板;第二步运用GMM匹配识别MFCC参数,从而在不影响识别率的前提下,极大缩减匹配识别的时间。 | ||
搜索关键词: | 基于 dtw gmm 模型 多维 特征 参数 声纹 识别 方法 | ||
【主权项】:
1.一种基于DTW和GMM模型的多维特征参数声纹识别方法,其特征在于,包括如下步骤:S1、语音信号采样,对训练语音和来自说话人的待识别语音进行采样收集;S2、语音信号预处理,将所采样的训练语音和待识别语音进行预处理;S3、语音信号特征参数提取,对训练语音及待识别语音进行特征参数提取,分别提取出梅尔倒谱系数和基音周期;S4、语音信号模型训练,对所采样的训练语音通过最大似然概率估计法得到高斯混合模型的均值、协方差矩阵和加权系数,记录得到的数据,保存相对应的高斯混合模型;S5、待识别语音信号匹配识别,先运用动态时间规整法匹配识别待识别语音,再运用高斯混合模型来匹配识别待识别语音,得出识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810515482.2/,转载请声明来源钻瓜专利网。