[发明专利]一种有序序列相似性对比方法的声纹识别应用无效
申请号: | 201110443922.6 | 申请日: | 2011-12-27 |
公开(公告)号: | CN102522086A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 吴丽丽;王守觉 | 申请(专利权)人: | 中国科学院苏州纳米技术与纳米仿生研究所 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L15/02 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 陈忠辉 |
地址: | 215125 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 有序 序列 相似性 对比 方法 声纹 识别 应用 | ||
技术领域
本发明涉及一种声纹识别技术,尤其涉及一种将极具运算简化性序列对比方法引入新型的声纹识别的一种应用技术。
背景技术
说话人识别和指纹,虹膜,人脸识别等一样,属于生物识别的一种,被认为是最自然的生物特征识别身份鉴定方式,又称“声纹”识别。说话人识别具有采集设备简单,系统价格低廉,容易被人们接受等优点。门禁系统、保险柜、个人设备(汽车、电脑、手机、PDA等)使用权限控制等使用场合,文本相关的说话人确认方法,可以通过说话人语音生物特征和语音内容双方面进行验证,同时短语音即可实现学习和测试过程,具有突出的应用优势。
说话人识别的基本过程为语音采集,特征提取,分类模型。常见的语音特征提取方法是利用语音的短时平稳特性,采用美倒谱变换(MFCC)方法将语音转换为语音特征点集。之后经过学习过程对说话人语音进行建模得到说话人的分类模型。隐马尔可夫模型(HMM)是目前公认的在文本相关的说话人识别中效果最好的建模方法。HMM一方面用隐含的状态对应于声学层相对稳定的发音单位,并通过状态转移和状态驻留来描述发音的变化;另一方面它引入了概率统计模型,用概率密度函数计算语音参数对HMM模型的输出概率,通过搜索最佳状态序列,以最大后验概率为准则找到识别结果。但其存在几个问题:(1)需要更多学习样本。(2)计算复杂度高。(3)得到的模型数据量大。对于资源有限的嵌入式系统,以上问题,限制了算法的使用。因此需要一种新的方法解决上述问题。
为了解决这一问题,设计了一种新的说话人特征变换方法(声纹识别方法,专利申请号为:2011106714601),这种新的特征变换方法将一段语音转换为一段有序序列,将说话人识别问题转换为有序序列的相似性比较问题。该序列具有时序性,不等长,同时相同符号间“杂质”较多(即相同符号间存在其它与相同符号无关的符号)的情况,传统的以编辑距离为基础的字符串比较方法存在未能考虑字符串序列的时序特性,同时计算复杂度高,依赖序列长度等问题。
发明内容
本发明的目的在于提出一种有序序列相似性对比方法的声纹识别应用,以解决计算复杂度高,依赖序列长度等问题。
为了解决以上技术问题,本发明一种有序序列相似性对比方法的声纹识别应用,所述声纹识别的过程包括语音特征空间建立,子空间划分,训练语句特征提取,测试语句特征提取及声纹序列比对识别,其特征在于:所述声纹序列比对识别采用有序序列相似性对比方法得到,包括步骤:Ⅰ、将两组有序序列转化为特征数组,对于任一组有序序列,所述特征数组按行分包括序列的标号、连续相同的该标号的个数和连续相同的首个标号的起始位置;Ⅱ、比较两个特征数组的列数,区分长、短数组;Ⅲ、对两个特征数组进行标号匹配,按序查找两组特征数组中具有相似位置特征的所有标号,并标记该些标号具有相似性贡献;Ⅳ、计算各具相似性贡献的标号的贡献大小,求和得到两组有序序列的整体相似性;Ⅴ、设定整体相似性相关的声纹判定阀值,得出声纹识别结果。
进一步地,所述特征数组的构成包括第一行为按出现次序记入的序列标号,连续相同的标号只记录一次,第二行为对应标号每个连续相同标号的个数,第三行为每个标号之前的所有标号个数取和与全部标号个数总和的商值。
进一步地,步骤Ⅲ中所述进行标号匹配是指顺序提取短数组中的标号,在长数组中查找该标号的位置并记录,每个短数组标号在长数组中的起始查找位置为上一个被记录的位置,遍历短数组全部标号,且当在长数组中找到匹配的标号时,对比标号在两数组中的位置相似型。
进一步地,步骤Ⅳ中所述贡献大小的计算为将判定为有贡献的两组标号的数量相除,比值小于1时取比值,比值大于1时取比值的倒数,之后乘以各组号数量分别占各自序列长度的比例。
实施本发明的有益效果为:通过将该序列相似性对比方法引入声纹识别应用,实现声纹的阀值可控判定,具有计算量小,节省存储资源等优点,克服了基于概率统计方法数据处理甚巨的问题,适合于系统资源有限的嵌入式系统使用。
附图说明
图1为有序序列相似性对比流程示意图。
图2为序列转化为特征数组的示意图。
图3为数组标号匹配示意图。
具体实施方式
鉴于背景技术中介绍的当前关于声纹识别研究中存在的问题,并且延续在先申请“一种声纹识别方法”的方法,出于节省存储资源及减少声纹识别要求的系统配置等需求,本发明创新提出了一种将有序序列相似性对比方法引入声纹识别的应用方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院苏州纳米技术与纳米仿生研究所,未经中国科学院苏州纳米技术与纳米仿生研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110443922.6/2.html,转载请声明来源钻瓜专利网。