[发明专利]一种结合I-vector和PLDA的声纹识别方法在审
申请号: | 202010767770.4 | 申请日: | 2020-08-03 |
公开(公告)号: | CN111883143A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 汪礼君 | 申请(专利权)人: | 汪礼君 |
主分类号: | G10L17/06 | 分类号: | G10L17/06;G10L17/02;G10L17/08;G10L17/20 |
代理公司: | 长沙正务联合知识产权代理事务所(普通合伙) 43252 | 代理人: | 郑隽;吴婷 |
地址: | 410205 湖南省长沙市高新*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 vector plda 声纹 识别 方法 | ||
本发明涉及一种声纹识别的技术领域,揭露了一种结合I‑vector和PLDA的声纹识别方法,包括:获取待识别声纹信号,利用谱减法对其进行降噪处理;对降噪后的待识别声纹信号进行预加重和加窗处理;基于声纹信号能量对待识别声纹信号进行分帧处理;利用WS语音特征提取算法提取有效声纹信号帧中的声纹信号特征;根据所提取出的声纹信号特征,利用I‑vector模型提取I‑vector特征;利用PLDA的建模方法,对I‑vector特征中的信道信息进行补偿;利用对数似然比方法进行声纹比对,根据比对结果实现声纹的识别。本发明实现了声纹的识别。
技术领域
本发明涉及声纹识别的技术领域,尤其涉及一种结合I-vector和PLDA的声纹识别方法。
背景技术
随着声纹识别技术不断向前发展,声纹识别在近年来出现了一个快速发展的新局面,声纹识别以其便捷性、稳定性和低成本性等特点在军事安全、医疗健康和司法鉴定等多个领域得到广泛应用,并逐渐成为生物识别技术中的主流之一。虽然在无噪环境中,声纹识别已经取得非常好的效果,但是在实际应用过程中,因为各种背景噪声的影响,声纹识别往往达不到理想的效果。
现有声纹特征提取技术主要为MFCC提取算法,该算法具有计算过程简单,易于实现的优点,但是该算法采用傅里叶变换分析语音信号,其中傅里叶变换采用固定分辨率分析信号,无法准确地分析非平稳的信号,导致MFCC对非平稳的语音的表达能力较弱,另外,傅里叶变换的全局性特性也使得MFCC对噪音较为敏感。
鉴于此,在考虑声纹识别准确率的基础上,如何对现有声纹特征提取算法进行改进,减少噪音对声纹的影响,成为本领域技术人员亟待解决的问题。
发明内容
本发明提供一种结合I-vector和PLDA(概率线性判别分析,ProbabilisticLinearDiscriminantAnalysis)的声纹识别方法,通过对现有声纹特征提取算法进行改进,并利用PLDA方法来补偿包含说话人特性信息和信道信息的i-vector特征,来达到消除信道不一致的干扰,实现声纹的识别。
为实现上述目的,本发明提供的一种结合I-vector和PLDA的声纹识别方法,包括:
获取待识别声纹信号,利用谱减法对其进行降噪处理;
对降噪后的待识别声纹信号进行预加重和加窗处理;
基于声纹信号能量对待识别声纹信号进行分帧处理;
利用WS语音特征提取算法提取有效声纹信号帧中的声纹信号特征;
根据所提取出的声纹信号特征,利用I-vector模型提取I-vector特征;
利用PLDA的建模方法,对I-vector特征中的信道信息进行补偿;
利用对数似然比方法进行声纹比对,根据比对结果实现声纹的识别。
可选地,所述利用谱减法对待识别声纹信号进行降噪处理,包括:
1)在时域对含噪声纹信号y(t)、待求解的干净声纹信号s(t)以及静音段的声纹信号n(t)进行关系表征:
y(t)=s(t)+n(t)
2)分别对上述三种信号进行傅里叶变换,其对应的短时频谱分别为Y(w),S(w)和N(w),根据语音的特征分布,它们服从均值为0的高斯分布,因此从概率统计学分析可知,它们之间存在如下的平方关系:
|Y(w)|2=|S(w)|2+|N(w)|2+2Re[S(w)N(w)]
3)由于噪声和语音信号之间是没有直接关联的,即噪声不会随着语音信号的改变而改变,也就是S(w)和N(w)是相互独立的,所以Re[S(w)N(w)]=0;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汪礼君,未经汪礼君许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010767770.4/2.html,转载请声明来源钻瓜专利网。