[发明专利]一种基于3D卷积神经网络的声纹识别方法在审
申请号: | 201810804229.9 | 申请日: | 2018-07-20 |
公开(公告)号: | CN109215665A | 公开(公告)日: | 2019-01-15 |
发明(设计)人: | 王艺航;熊晓明;刘祥;李辉 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G10L17/18 | 分类号: | G10L17/18;G10L17/02;G10L21/0232;G10L25/24 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杜鹏飞;杨晓松 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 谱相减法 信道噪声 预处理 卷积神经网络 声纹识别 语音信号 纯净语音 录音设备 输入语音 物理意义 信道噪音 语音采集 约束条件 噪声频谱 运算量 减去 频谱 去噪 去除 噪声 语音 保存 引入 | ||
本发明公开了一种基于3D卷积神经网络的声纹识别方法,包括下述步骤:步骤一,对语音信号的预处理;语音采集过程中会产生较多的信道噪声,则会给识别任务带来较大的困难,因此首先采用谱相减法对输入语音数据进行去噪处理,即从带噪语音估值中减去噪声频谱估值,从而得到纯净语音的频谱;此处消除的是信道噪声,信道噪声是由录音设备所导致的噪声;去除信道噪音的同时,完全保存了与说话人有关的所有信息;本发明的语音信号预处理采用谱相减法,相对于其它方法,谱相减法引入的约束条件最少,物理意义最直接,运算量小,从而可以有效提高识别的准确性。
技术领域
本发明涉及深度学习及语音信号处理技术领域,具体涉及一种基于3D卷积神经网络的声纹识别方法。
背景技术
随着世界信息化进程日新月异,信息安全问题日趋严重,造成的影响越来越大,“个人隐私保密”问题迫切需要解决;而如何准确而安全的确定一个人的身份引起人们的思考。传统的安全认证方法比如密码或密钥认证通常易忘、易丢、易盗。常见的声纹识别方法比如早期的基于信号处理的声纹识别方法,使用信号处理技术中一些技术方法计算出语音数据在信号学的参数,然后进行模板匹配、统计方差分析等,该方法对语音数据极为敏感,准确率很低,识别效果很不理想。基于高斯混合模型的识别方法能取得较好的效果且简单灵活,但其对语音数据量要求很大,对信道环境噪声非常敏感,无法满足真实场景下的要求。现有的基于深度学习神经网络的方法并未考虑语音信号的上下文相关的本质,提取到的特征并不能很好地代表说话人,并没有完全发挥深度学习的优势。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于3D卷积神经网络的声纹识别方法,该方法可与其它生物特征识别(人脸,语音,虹膜,指纹等)相结合,提高安全性和准确率,可应用于远程登录,交易支付,语音拨号,门禁系统等场合。
本发明的目的通过下述技术方案实现:
一种基于3D卷积神经网络的声纹识别方法,包括下述步骤:
步骤一,对语音信号的预处理;语音采集过程中会产生较多的信道噪声,则会给识别任务带来较大的困难,因此首先采用谱相减法对输入语音数据进行去噪处理,即从带噪语音估值中减去噪声频谱估值,从而得到纯净语音的频谱;此处消除的是信道噪声,信道噪声是由录音设备所导致的噪声;去除信道噪音的同时,完全保存了与说话人有关的所有信息;
其中,所述谱相减法的具体步骤如下:
首先对输入的语音信号进行预滤波,对滤波后的语音信号进行预加重,将语音信号分帧,对信号帧加汉明窗,对加窗后的信号进行FFT变换,对各帧语音信号求功率谱,然后求平均噪声功率,利用VAD进行噪声估计监测寂静段,进而组合递归平滑,更新噪声谱,进行谱减运算,得出估计的语音信号功率谱,然后插入相位谱,计算出语音谱,再进行IFFT变换,得到还原的语音帧,根据各个语音帧组合为语音信号,将语音信号加重得到最终信号;
步骤二,声学特征的提取和拼接;对步骤一中得到的纯语音数据按照帧长25ms、帧移10ms进行分帧,每一条语音数据能够分为多帧语音信号,分别计算每一帧语音信号的MFCC特征参数;
其中,所述计算MFCC特征参数的具体步骤如下:
首先将语音信号通过一个高通滤波器,即预加重处理,然后将信号分帧,每一帧乘以汉明窗,之后每帧再经过FFT变换以得到在频谱上的能量分布,然后将功率谱通过一组Mel标度的三角形滤波器组,计算每个滤波器组输出的对数能量,最后经过DCT变换得到MFCC特征参数;然后选择前13维MFCC特征参数并继续计算其一阶和二阶差分,分别提取前13维MFCC特征拼接成为一个39维的特征向量,由此作为这一帧语音信号的特征参数;然后将每39帧语音信号的39个特征合并成为一个39*39的二维数据,不足39帧的语音信号丢弃;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810804229.9/2.html,转载请声明来源钻瓜专利网。