[发明专利]基于听觉中枢感知机理的说话人识别方法有效
申请号: | 202010268019.X | 申请日: | 2020-04-08 |
公开(公告)号: | CN111508504B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 牛晓可;黄伊鑫;徐华兴;王治忠 | 申请(专利权)人: | 郑州大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/20;G10L25/03;G10L25/18;G10L25/24;G10L21/0208 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 宁政 |
地址: | 450001 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 听觉 中枢 感知 机理 说话 识别 方法 | ||
本发明公开了基于听觉中枢感知机理的说话人识别方法,步骤1:采用OM‑LSA算法与MCRA算法结合的方法对说话人语音信号进行降噪预处理;步骤2:利用STRF模型将预处理后的语音信号投射到特定的频谱‑时间空间,生成频域‑时间谱图,并进一步提取频域‑时间谱图的二次特征;步骤3:提取降噪预处理后语音信号中的MFCC系数特征;步骤4:将步骤2中的二次特征与步骤3中的MFCC系数进行组合;步骤5:采用常规的支持向量机对步骤4中二次特征与MFCC系数组合后的声纹特征进行分类与识别。本发明能够在强噪声环境下对说话人进行识别,具有较高的识别正确率,且对噪声具有较强的鲁棒性。
技术领域
本发明涉及语音信号处理领域,具体涉及基于听觉中枢感知机理的说话人识别方法。
背景技术
生物识别技术在过去几十年得到了广泛研究与应用,说话人识别作为仅次于掌纹和指纹识别的第三大生物特征识别技术,目前世界市场占有率为15.8%,并有逐年上升的趋势。相较于指纹和掌纹这些生物特征识别技术,声纹识别技术发展较晚,但在应用上因具备语音提取方便、适合远程身份确认等特点而具有明显优势。该技术的实现原理主要为声纹特征的提取与匹配,即:首先,从与文本不相关的语音片段中提取出说话人的声纹特征;然后,建立对应的说话人模型即声纹数据库,最后,在测试时采用相同特征提取方法与说话人模型,获取被测试说话人的语音特征,并与声纹数据库中的特征进行匹配,根据匹配结果判决说话人的身份。总的来讲,说话人识别技术的研究可概括为声纹特征参数的提取与说话人模型构建。
在声纹特征参数的提取方面,MFCC即Mel频率倒谱系数(Mel-Frequency CeptralCoefficients)是较为常用的,操作简单、样本量小,但其主要描述了声道特征,在没有噪声时有很好的特征表达,但在高噪声存在下鲁棒性明显降低。针对噪声环境下语音识别系统的鲁棒性问题,目前已经有很多学者提出了不同的方法,典型的方法主要有:感知听觉场景分析、小波变换法、模型补偿法的鲁棒语音识别分析、信号空间的鲁棒语音识别分析、模拟生物听觉感知特性法,生物的听觉系统对噪声具有很强的鲁棒性,因此近些年来模拟生物听觉特性进行语音识别的方法越来越受到研究者的青睐,其典型代表是:Taishih Chi等人于2005年首次将生物听皮层神经元频谱-时间感受野(STRF)的概念引用到了简单的语音处理中,并提出了一套神经计算模型,解释了从外部输入的声音信号是如何转换为大脑传递的电信号。但是基于听皮层神经元频谱-时间感受野(STRF)提取的特征相较于传统MFCC系数,基于听皮层神经元频谱-时间感受野(STRF)模型声纹的特征对噪声鲁棒性较强,但识别准确率较低,所以提出一种基于听觉中枢感知机理的说话人识别方法,在低信噪比条件或强噪声环境下对说话人身份的确认与识别。
发明内容
本发明的目的在于:提供了基于听觉中枢感知机理的说话人识别方法,解决了现有单一声纹特征的缺陷,使得基于STRF的二次特征与MFCC系数特征组合,能够在强噪声环境下对说话人进行识别,具有较高的识别正确率,且对噪声具有较强的鲁棒性。
本发明采用的技术方案如下:
本发明是基于听觉中枢感知机理的说话人识别方法,该方法具体包括以下步骤:
步骤1:采用OM-LSA算法与MCRA算法结合的方法对说话人含噪声的语音信号进行降噪预处理;
步骤2:利用STRF模型将预处理后的语音信号投射到特定的频谱-时间空间,生成频域-时间谱图,并进一步提取频域-时间谱图的二次特征;
步骤3:提取降噪预处理后语音信号中的MFCC系数特征;
步骤4:将步骤2中的二次特征与步骤3中的MFCC系数进行组合;
步骤5:采用常规的支持向量机对步骤4中二次特征与MFCC系数组合后的声纹特征进行分类与识别。
进一步的,所述步骤1中含噪声语音信号的预处理方法具体步骤为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州大学,未经郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010268019.X/2.html,转载请声明来源钻瓜专利网。