[发明专利]基于DTW和GMM模型的多维特征参数声纹识别方法有效

专利信息
申请号: 201810515482.2 申请日: 2018-05-25
公开(公告)号: CN108922541B 公开(公告)日: 2023-06-02
发明(设计)人: 邓立新;李秀 申请(专利权)人: 南京邮电大学
主分类号: G10L17/04 分类号: G10L17/04;G10L17/02;G10L17/06;G10L25/78;G10L25/87;G10L25/24;G10L25/93
代理公司: 南京苏科专利代理有限责任公司 32102 代理人: 姚姣阳
地址: 210003 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 dtw gmm 模型 多维 特征 参数 声纹 识别 方法
【说明书】:

一种基于DTW和GMM模型的多维特征参数声纹识别方法,包括如下步骤:S1、语音信号采样,S2、语音信号预处理,S3、语音信号特征参数提取,S4、语音信号模型训练,S5、待识别语音信号匹配识别。本发明通过在MFCC的基础上引入基音周期的方式,构造出经过改进的多维特征参数,不仅有效地提升了声纹识别的识别率,而且也避免了现有技术中因单独使用MFCC参数所造成的易被模仿的缺陷。同时,本发明采用了两步匹配识别算法,第一步运用DTW法部分匹配基音周期这个特征参数,进行初步识别,筛选掉数据库中不匹配的模板;第二步运用GMM匹配识别MFCC参数,从而在不影响识别率的前提下,极大缩减匹配识别的时间。

技术领域

本发明涉及一种声纹识别方法,尤其涉及一种基于DTW和GMM模型的多维 特征参数声纹识别方法,属于信号识别与处理领域。

背景技术

随着信息技术的快速发展和迅速普及,信息安全问题越来越受到人们的关 注,如何快速、准确地认证使用者的身份,保护个人隐私和保障信息安全,也 日益成为目前信息安全领域亟待解决的一个重要问题。与传统身份认证方式相 比,生物特征识别身份认证技术在使用过程中具有不会丢失、被盗或遗忘的特 性,通过生物特征来进行身份认证,不仅认证过程快捷、方便,而且认证结果 也十分准确、可靠。

在种类繁多的生物特征识别技术中,声纹识别技术可以称得上是当前最热 门的生物特征识别技术之一,由于其在远程认证等应用领域中具有独特优势, 因此受到了业内的持续关注。

声纹识别又可以称作说话人识别,简单来说,其基本原理是把待检测的说 话人和已经建立的说话人库中所有的语音信号进行比较,并加以判断,确立是 否为其中一员。目前,大多数的声纹识别系统一般都只提取梅尔倒谱系数作为 说话人语音信号的特征参数,并用高斯混合模型作为模型对语音信号的进行训 练和识别。

例如中国专利CN102324232A揭示了一种基于高斯混合模型的声纹识别方法 及系统,步骤包括:语音信号采集;语音信号预处理;语音信号特征参数提 取:采用梅尔频率倒谱系数(MFCC),MFCC的阶数通常取为12~16;模型训练: 采用EM算法为说话人的语音信号特征参数训练高斯混合模型(GMM),模型的参 数初始化方法选用k-means算法;声纹辨识:将采集到的待识别语音信号特征 参数与已建立的说话人语音模型进行比较,并根据最大后验概法进行判断,若 对应的说话人模型使得待识别的话者语音特征向量X具有最大的后验概率,则 识别出说话人。

虽然上述技术方案具备一定的识别性能和抗噪能力,但是仍然存在着诸多 不足。具体而言,梅尔倒谱系数(MFCC)虽然可以描述语音频率结构的时间变化 信息,反应出声道运动的动态特征(发音方式、发音习惯等),但是其描述的 特征很容易被模仿,在应用过程中很容易出现误判情况。此外,使用高斯混合 模型(GMM)来表述说话人样本在声学特征空间中的分布,虽然在语音信号的训 练和匹配识别研究中取得了很好的效果,但是其计算量较大,所需要的匹配识 别时间一般都很长,这一点在实际的应用过程中也会是一项缺陷。

为了应对和解决上述问题,技术人员开始尝试将动态时间规整法(DTW) 应用于声纹识别中,动态时间规整法可以把两个不同长度的语音信号的特征进 行时间上的“对齐”,进而计算其最短路径,来判断两个语音是否相似。但是 目前,将这一技术应用于声纹识别还处于理论阶段,仍存在着诸多的不完善。

综上所述,人们亟待一种能够充分利用DTW模型、实现识别正确率和匹配 识别时间共同优化的声纹识别方法,以满足实际的使用需要。

发明内容

鉴于现有技术存在上述缺陷,本发明的目的是提出一种基于DTW和GMM模型 的多维特征参数声纹识别方法。

一种基于DTW和GMM模型的多维特征参数声纹识别方法,包括如下步骤:

S1、语音信号采样,对训练语音和来自说话人的待识别语音进行采样收 集;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810515482.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top