[发明专利]一种高精度说话人确认方法无效

专利信息
申请号: 201310075089.3 申请日: 2013-03-08
公开(公告)号: CN103198833A 公开(公告)日: 2013-07-10
发明(设计)人: 罗森林;谢尔曼;潘丽敏 申请(专利权)人: 北京理工大学
主分类号: G10L17/02 分类号: G10L17/02;G10L17/14
代理公司: 暂无信息 代理人: 暂无信息
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 高精度 说话 确认 方法
【说明书】:

技术领域

发明涉及一种高精度的文本无关说话人确认方法,属于生物识别技术领域;从技术实现的角度来讲,亦属于计算机科学与语音处理技术领域。 

背景技术

说话人确认(Speaker Verification)技术是利用每个说话人的语音信号特点,从一段语音中提取说话人信息,进而确认某段语音是否是指定的某个人所说的,系统只给出“接受”或“拒绝”两种选择,是“一对一”的模式识别问题。 

说话人确认技术与说话人辨认技术同属说话人识别(Speaker Recognition,SR)的范畴,而与说话人辨认技术不同,说话人确认技术对于准确率、识别时间的要求更为严格,近年来,电话自动接听系统、计算机身份认证系统、高密级门禁系统等应用平台对这项技术的应用需求越来强。 

按照说话内容的类型不同,说话人确认可以分为文本有关(Text-dependent)和文本无关(Text-independent)两大类。与文本有关的说话人确认系统要求用户按照规定的内容发音,每个人的识别模型逐个被精确地建立,而识别时也必须按规定的内容发音;文本无关的识别系统则不规定说话人的发音内容,模型建立相对困难,可应用范围较宽。有些情况下,人们无法(或者不希望)强迫说话人朗读一段特定的文字,在这些应用场景中,文本无关的说话人确认方法就显得格外重要。 

本无关的说话人确认的基本技术可分为语音采集,特征提取,分类方法三个层次,其中关键问题在于特征提取与分类方法。 

特征提取方面,目前的主流方法多采用基于底层声学原理的梅尔倒谱系数(MFCC)或线性预测倒谱系数(Linear Predictive Coding Cepstrum,LPCC)作为特征参数。 

分类方法方面,主流方法有动态时间规整(DTW)、矢量量化(VQ)、隐马尔可夫模型(HMM)、高斯混合模型(GMM)、人工神经网络(ANN)、支撑向量机(SVM)等。目前广泛受到研究的是高斯混合模型(GMM)方法以及支撑向量机(SVM)方法。上述方法中,GMM-UBM模型已经得到广 泛应用,在更早的系统中,矢量量化也是一项获得了广泛研究的重要的技术。 

基于上述方法,文本无关的说话人确认技术已经在一些场合得到实际应用。然而,当待确认的人数不断增加时,上述方法的准确率会明显下降,当人数增加到一定规模时,将难以满足实际应用的需求,这是文本无关说话人确认技术需要解决的一个重要问题。 

发明内容

本发明的目标是:提出一种大规模说话人确认方法,能在获得高准确率的同时兼顾高运算速度的要求。具体实施方法上,本发明从特征提取和分类方法两个层次分别提出新的方法,提高特征的区分度,提升说话人分类器的速度与准确率。 

本发明的设计原理为:在特征提取层次,提出2D-Haar音频特征提取方法,引入一定的时序关系信息,并将音频特征空间扩展至数十万维,为确认算法提供更加庞大的特征空间;在说话人分类器层次,提出Turbo-Boost算法,在庞大的2D-Haar特征空间中筛选具有代表性的特征组合,用于构建目标说话人的确认分类器。在相同的时间内,本发明可以将既有的识别准确率进一步提升,以满足说话人确认应用中快速、准确的技术要求。 

本发明的技术方案是通过如下步骤实现的: 

步骤1,获取待确认说话人(即目标说话人)的语音信号,形成基础语音库S。 

具体方法为:把麦克风与计算机连接,获取目标说话人的语音信号,并以音频文件的形式存储在计算机内,每个目标说话人对应一个音频文件,形成基础语音库S={s1,s2,s3,…,sk},其中k为目标说话人的总数。 

步骤2,对基础语音库S中的语音进行音频特征积分图计算,形成基础特征库R。具体过程如下: 

步骤2.1,对于第k个目标说话人,对其音频文件sk进行分帧处理(帧长fs、帧移Δfs由用户设定),并提取各帧的基础音频特征(如MFCC、LPCC、子带能量等),将各帧的基础音频特征组合,形成一个包含c帧、每帧p维特征量的基础特征文件vk。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310075089.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top