[发明专利]一种应对复杂声学环境的说话人确认方法、系统及存储介质在审
申请号: | 202010871239.1 | 申请日: | 2020-08-26 |
公开(公告)号: | CN111986679A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 刘明;周彦兵;孙冲武;赵学华;高波 | 申请(专利权)人: | 深圳信息职业技术学院 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L21/0208;G10L25/12;G10L25/24;G10L25/30;G10L25/45 |
代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 黎健任 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应对 复杂 声学环境 说话 确认 方法 系统 存储 介质 | ||
1.一种应对复杂声学环境的说话人确认方法,其特征在于,包括执行以下步骤:
步骤1:输入说话人音频;
步骤2:接收步骤1的说话人音频,再采用梅尔倒谱系数提取模块和线性预测提取模块提取出所接收的说话人音频中的人工声纹特征,最后将提取的人工声纹特征送到特征增强模块;
步骤3:采用特征增强模块接收步骤2提取的人工声纹特征,并通过特征增强模块对所接收的人工声纹特征进行降噪处理,得到增强后的人工声纹特征,最后将增强后的人工声纹特征送到声纹识别模块;
步骤4:采用声纹识别模块接收增强后的人工声纹特征,进行更深层次的抽象表示分析,再在神经网络的输出层得到新的特征表示形式,最后计算不同语句之间的相似值,输出相似度向量,并做出是否是目标说话人的判决。
2.根据权利要求1所述的说话人确认方法,其特征在于,在所述步骤2中,所述梅尔倒谱系数提取模块还包括依次执行以下步骤:
预处理步骤:将原始语音信号进行采样量化、预加重、加窗分帧预处理,得到每一帧语音信号的语音序列s(n);
傅里叶变换步骤:对预处理后得到的语音序列s(n)进行快速傅里叶变换,将其从时域变换到频域,得到其频谱,并求得频谱的幅度值S(k);
滤波步骤:将幅度值S(k)通过梅尔频率滤波器组Hm(k)得到的输出为Pm(m=0,1,…,M-1),参数Pm的表达公式如下:
其中,Hm(k)是梅尔频率滤波器组的传递函数,其定义表达如下式所示:
公式(2)中M为三角形滤波器的数量,即梅尔滤波器组的阶数,f(m)是三角形滤波器的中心频率;f(m-1)和f(m+1)分别表示一个三角形滤波器的上限频率与下限频率;
梅尔倒谱系数计算步骤:对参数Pm进行对数能量计算,输出得到的参数为Lm(m=0,1,…,M-1),再将参数Lm进行离散余弦变换,将得到的参数Lm转换到倒谱域中,这样就得到了梅尔倒谱系数Cmel,其具体过程如下:
Lm=ln(Pm),(m=0,1,…,M-1) (3)
上式(4)中的Cmel(k)就是所需要求取的MFCC特征参数,N表示梅尔倒谱系数的阶数,这里我们取N=40,也就是提取40维的MFCC特征。
3.根据权利要求1所述的说话人确认方法,其特征在于,在所述步骤2中,所述线性预测提取模块还包括依次执行以下步骤:
步骤S1:对输入的语音信号进行预加重、分帧加窗和滤波的预处理;
步骤S2:为了求解线性预测系数,令并写出自相关函数的形式如下:
其中R(j)是自相关函数,拆写加权式子,便得到如下的Toeplize矩阵表达形式:
步骤S3:使用Durbin算法来求解Toeplize矩阵,即可计算出滤波器系数ai,也就是线性预测系数,进而求得线性预测系数的残差值e(n),取p=38,也就是提取38维的线性预测系数;
步骤S4:对残差信号e(n)进行快速傅里叶变换,使其从时域变换到频域,得到其频谱,将残差频谱的一阶矩、二阶矩也作为特征参数,与提取的38维线性预测系数一起组成该模块的40维线性预测特征。
4.根据权利要求1所述的说话人确认方法,其特征在于,在所述步骤3中,所述特征增强模块采用了前馈神经网络构建降噪模型,该模型一共由五层神经网络层构成,其中输入层输入的是人工提取的80维声纹特征,后面连接着三层隐藏层,每层隐藏层有1024个神经元,并采用ReLU非线性函数作为激活函数,输出层为线性层,采用80个神经元用来实现增强特征的重构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳信息职业技术学院,未经深圳信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010871239.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种双机翼压差式流量计用可拆卸式防护装置
- 下一篇:一种铁质工艺品除锈的方法