[发明专利]一种基于信道补偿的声纹识别方法及系统在审
申请号: | 202010554305.2 | 申请日: | 2020-06-17 |
公开(公告)号: | CN111785281A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 沈亮;万辛;李鹏;倪江帆;高圣翔;冯象雷;孙旭东;占建波;宁珊;孙晓晨 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;讯飞智元信息科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/06;G10L17/18;G10L21/0208 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100020*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信道 补偿 声纹 识别 方法 系统 | ||
1.一种基于信道补偿的声纹识别方法,其特征在于,包括如下步骤:
步骤SS1:初始化去噪网络G和判别网络D;
步骤SS2:输入噪声音频到去噪网络G,生成fake音频,将所述fake音频和真实的干净音频送入到判别网络D进行训练,更新判别网络D的网络参数,得到新一代判别网络D1;
步骤SS3:冻结判别网络D1的参数,在去噪网络G中输入噪声音频,同时将对应的判别标签设为True,来欺骗判别网络D1;
步骤SS4:重复步骤SS2至步骤SS3,直至判别网络D收敛,转入步骤SS5;
步骤SS5:去噪网络G输出增强音频信号。
2.根据权利要求1所述的一种基于信道补偿的声纹识别方法,其特征在于,所述去噪网络G包括编码器Genc、解码器Gdec,所述编码器Genc与所述解码器Gdec通讯连接。
3.根据权利要求2所述的一种基于信道补偿的声纹识别方法,其特征在于,输入噪声音频,经过所述编码器Genc对音频提取深层次特征z,然后经过解码器Gdec对特征z进行解码,输出增强之后的音频。
4.一种基于信道补偿的声纹识别系统,其特征在于,包括:
去噪网络G,用于对噪声音频进行去噪增强;
音素分类网络,用于对音素分类,输出音素分类后验概率;
判别网络D,输出0或者1,用于判别输入到判别网络D的音频是来自真实数据,还是由去噪网络G生成的假数据;
所述去噪网络G与所述判别网络D构成去噪深度神经网络,所述去噪网络G的输出端分别通讯连接所述音素分类网络的输入端、所述判别网络D的输入端。
5.根据权利要求4所述的一种基于信道补偿的声纹识别系统,其特征在于,所述去噪网络G包括编码器Genc、解码器Gdec,所述编码器Genc与所述解码器Gdec通讯连接。
6.根据权利要求5所述的一种基于信道补偿的声纹识别系统,其特征在于,输入噪声音频,经过所述编码器Genc对音频提取深层次特征z,然后经过解码器Gdec对特征z进行解码,输出增强之后的音频。
7.根据权利要求4所述的一种基于信道补偿的声纹识别系统,其特征在于,所述音素分类网络采用全连接神经网络。
8.根据权利要求4所述的一种基于信道补偿的声纹识别系统,其特征在于,所述去噪深度神经网络的损失L包括音素分类网络损失Ly和去噪深度神经网络损失Lz,如下式即:
L=Ly+λLz;
其中,λ0是权重系数,用于控制去噪深度神经网络损失所占的比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;讯飞智元信息科技有限公司,未经国家计算机网络与信息安全管理中心;讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010554305.2/1.html,转载请声明来源钻瓜专利网。