[发明专利]一种基于小波包变换的声纹特征提取算法在审
申请号: | 201710324326.3 | 申请日: | 2017-05-10 |
公开(公告)号: | CN107093430A | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 黄金杰;张厚振;贾海阳;潘晓真;张青春 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L19/02;G10L17/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 波包 变换 声纹 特征 提取 算法 | ||
技术领域
本发明涉及语音特征参数提取和识别领域,具体是一种利用小波包的变换将声纹特征进行提取的设计系统。
背景技术
在生物学和信息科学高度发展的今天,生物认证技术作为一种便捷、先进的信息安全技术开始在全球电子商务时代崭露头角;这是一种根据人自身的生理特征如:指纹、手形、脸部、虹膜、视网膜、气味等和行为特征:声音、签名、击键方式等来识别身份的技术;它是集光学、传感技术、红外扫描和计算机技术于一身的第三代身份验证技术,能满足现代社会对于身份鉴别的准确性、安全性与实用性的更高要求;在生物认证技术中,说话人识别技术以其独特的方便性、经济性、和准确性受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。
在众多的生物技术中,说话人识别技术表现出很多应用上的优势;首先,说话人识别技术有着天然的优点:以声音作为识别特征,因其不接触性和自然性,用户很容易接受,不存在心理上的障碍;在说话人识别过程中,用户不用刻意的去将手指放在传感器上,或者把眼睛靠上摄像头,只需随意的说几句话即可完成识别;其次,说话人识别所用的设备成本低廉;如:输入设备麦克风、电话送话机等没有特征别的要求;声音采样与量化对芯片的要求也很低;特征提取、模型训练和匹配只需普通的计算机即可;另外,现在的电子设备很多都是集麦克风,计算机为一体,所以识别系统所需的硬件成本会很低。
语音特征提取方面:从1963年到1973年的十年间,研究人员先后采用带通滤波器组、基因频率、倒谱特征、共振峰、线性预测系数、语音对数域比例、时域音栓配合法的语音响度、Mel频率倒谱系数、小波变换系数、Mel频率倒谱系数与PCA混合参数、Mel频率倒谱系数与Delta混合参数等特征参数进行说话人识别;1974年,阿尔塔通过对线性预测系数、自相关系数、声道的冲激响应和面积函数以及倒谱系数的比较,得出在当时实验条件下倒谱系数的识别效果最好的结论,从七十年代末起,研究人员对识别方法和匹配度等方面展开了深入研究。
发明内容
本发明要解决的技术问题是提出一种语音特征参数提取的算法,具有良好的鲁棒性和低复杂度,且识别出的结果很好。
一种基于小波包的变换将声纹特征进行提取的算法,具体步骤:
(1)、将采样频率为8000Hz的一帧语音信号x(n)进行5层小波包分解,但只取其中的17个节点,17个节点分别为(5,i),i=1,2,3,4,5,6,7,12,13,(3,j),j=4,5,6,7,(4,k),k=4,5,7,(i,j)代表第i层第j+1节点处的小波包系数,取这17个节点处的小波包系数的原则是根据语音的频谱能量集中区间划分;
(2)、计算一帧语音信号所取各节点处的小波包系数,分别为:
wpcn=[cb,m(0),cb,m(1),…,cb,m(k)](1)
式(1)中wpcn表示在节点(b,m)节点下的小波包系数,k表示在节点(b,m)下的小波包系数维数(或长度),n为第几个小波包系数,且n=1,2,3,…,17;当b=3时,m=4,5,6,7;k=257,n=1,2,3,4。当b=4时,m=4,5,7;k=133;n=5,6,7。当b=5时,m=1,2,3,4,5,6,7,12,13;k=66;n=8到17;
(3)、对第二步所求出的各小波包系数进行求能量之和,公式为:
En=∑[wpcn2(1),wpcn2(2),…,wpcn2(k)] (2)
式中n=1,2,3,…,17;
(4)、第三步得到的En进行取对数,得:
Q(n)=log(En) (3)
(5)、求一帧语音的DWPT参数:
DWPT=dct[Q(0),Q(1),…,Q(n)] (4)
本发明与现有的声纹提取技术相比,采用了最近几年研究最火的小波变换,将时间序列的语音信息进行高频和低频信息的5层分解,在通过对分解的具体节点处的语音信息进行能量求和,取对数计算,形成声纹特征提取的算法;该算法的优势在于小波包对语音信息分解的频带能很好的模拟人耳的听觉特性,提取出的特征在LBG-VQ识别模型下识别效果很好。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710324326.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:主动降噪方法、系统及汽车
- 下一篇:一种用于通信系统的语音质量评价系统