[发明专利]基于DTW和GMM模型的多维特征参数声纹识别方法有效
申请号: | 201810515482.2 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108922541B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 邓立新;李秀 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/02;G10L17/06;G10L25/78;G10L25/87;G10L25/24;G10L25/93 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 dtw gmm 模型 多维 特征 参数 声纹 识别 方法 | ||
一种基于DTW和GMM模型的多维特征参数声纹识别方法,包括如下步骤:S1、语音信号采样,S2、语音信号预处理,S3、语音信号特征参数提取,S4、语音信号模型训练,S5、待识别语音信号匹配识别。本发明通过在MFCC的基础上引入基音周期的方式,构造出经过改进的多维特征参数,不仅有效地提升了声纹识别的识别率,而且也避免了现有技术中因单独使用MFCC参数所造成的易被模仿的缺陷。同时,本发明采用了两步匹配识别算法,第一步运用DTW法部分匹配基音周期这个特征参数,进行初步识别,筛选掉数据库中不匹配的模板;第二步运用GMM匹配识别MFCC参数,从而在不影响识别率的前提下,极大缩减匹配识别的时间。
技术领域
本发明涉及一种声纹识别方法,尤其涉及一种基于DTW和GMM模型的多维 特征参数声纹识别方法,属于信号识别与处理领域。
背景技术
随着信息技术的快速发展和迅速普及,信息安全问题越来越受到人们的关 注,如何快速、准确地认证使用者的身份,保护个人隐私和保障信息安全,也 日益成为目前信息安全领域亟待解决的一个重要问题。与传统身份认证方式相 比,生物特征识别身份认证技术在使用过程中具有不会丢失、被盗或遗忘的特 性,通过生物特征来进行身份认证,不仅认证过程快捷、方便,而且认证结果 也十分准确、可靠。
在种类繁多的生物特征识别技术中,声纹识别技术可以称得上是当前最热 门的生物特征识别技术之一,由于其在远程认证等应用领域中具有独特优势, 因此受到了业内的持续关注。
声纹识别又可以称作说话人识别,简单来说,其基本原理是把待检测的说 话人和已经建立的说话人库中所有的语音信号进行比较,并加以判断,确立是 否为其中一员。目前,大多数的声纹识别系统一般都只提取梅尔倒谱系数作为 说话人语音信号的特征参数,并用高斯混合模型作为模型对语音信号的进行训 练和识别。
例如中国专利CN102324232A揭示了一种基于高斯混合模型的声纹识别方法 及系统,步骤包括:语音信号采集;语音信号预处理;语音信号特征参数提 取:采用梅尔频率倒谱系数(MFCC),MFCC的阶数通常取为12~16;模型训练: 采用EM算法为说话人的语音信号特征参数训练高斯混合模型(GMM),模型的参 数初始化方法选用k-means算法;声纹辨识:将采集到的待识别语音信号特征 参数与已建立的说话人语音模型进行比较,并根据最大后验概法进行判断,若 对应的说话人模型使得待识别的话者语音特征向量X具有最大的后验概率,则 识别出说话人。
虽然上述技术方案具备一定的识别性能和抗噪能力,但是仍然存在着诸多 不足。具体而言,梅尔倒谱系数(MFCC)虽然可以描述语音频率结构的时间变化 信息,反应出声道运动的动态特征(发音方式、发音习惯等),但是其描述的 特征很容易被模仿,在应用过程中很容易出现误判情况。此外,使用高斯混合 模型(GMM)来表述说话人样本在声学特征空间中的分布,虽然在语音信号的训 练和匹配识别研究中取得了很好的效果,但是其计算量较大,所需要的匹配识 别时间一般都很长,这一点在实际的应用过程中也会是一项缺陷。
为了应对和解决上述问题,技术人员开始尝试将动态时间规整法(DTW) 应用于声纹识别中,动态时间规整法可以把两个不同长度的语音信号的特征进 行时间上的“对齐”,进而计算其最短路径,来判断两个语音是否相似。但是 目前,将这一技术应用于声纹识别还处于理论阶段,仍存在着诸多的不完善。
综上所述,人们亟待一种能够充分利用DTW模型、实现识别正确率和匹配 识别时间共同优化的声纹识别方法,以满足实际的使用需要。
发明内容
鉴于现有技术存在上述缺陷,本发明的目的是提出一种基于DTW和GMM模型 的多维特征参数声纹识别方法。
一种基于DTW和GMM模型的多维特征参数声纹识别方法,包括如下步骤:
S1、语音信号采样,对训练语音和来自说话人的待识别语音进行采样收 集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810515482.2/2.html,转载请声明来源钻瓜专利网。