[发明专利]一种基于词嵌入的LSTM网络声纹识别方法在审
申请号: | 201910642258.4 | 申请日: | 2019-07-16 |
公开(公告)号: | CN110349588A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 闫河;罗成;李焕;董莺艳 | 申请(专利权)人: | 重庆理工大学 |
主分类号: | G10L17/18 | 分类号: | G10L17/18;G10L17/02 |
代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 胡逸然 |
地址: | 400054 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音片段 声纹识别 降维 嵌入 网络 嵌入的 快速傅里叶变换 分类信息 时间刻度 时序特征 特征提取 网络训练 准确率 捕捉 分类 身份 转化 | ||
本发明公开了一种基于词嵌入的LSTM网络声纹识别方法,包括以下步骤:S1、获取待识别语音片段;S2、通过快速傅里叶变换将待识别语音片段的时间刻度、频率和振幅转化,生成待识别语音片段的语谱图;S3、将待识别语音片段的语谱图通过词嵌入处理进行降维后输入训练后的LSTM网络,得到待识别语音片段的身份分类信息。本发明基于词嵌入降维的语谱图特征提取方法,来提高语谱图在网络训练中的有效性,同时利用LSTM网络具有很好的时序特征捕捉能力的特点,采用LSTM网络对词嵌入降维后的语谱图进行分类,实现了高准确率的声纹识别。
技术领域
本发明属于语音技术领域,具体涉及一种基于词嵌入的LSTM网络声纹识别方法。
背景技术
声纹识别是一种通过声音判别说话人身份的一种生物识别技术。目前在刑侦、金融及互联网等方面均有应用。声纹特征提取是指在声纹识别过程中,用来表征说话人语音个性性能的信息,由于人在发声时是声带和其他器官相结合共同震动产生的,发声特点根据声音不同而产生变化,这些变化时非线性的,不同人之间的非线性变化也不同。目前声纹识别研究领域中通常考虑较多的是线性预测系数、梅尔倒谱系数、语谱图特征等参数,其中语谱图是目前深度学习研究领域在声纹识别方向中常用到的一种特征表示,它是语音频谱的时间序列图。语谱图中除了包含有丰富的说话人个性信息局部空间特征和时序特征外,也存在空白语音信息片段和语音能量不足,会导致语谱图的背景颜色存在大量的冗余信息以至于网络训练无法快速收敛,给计算过程带来巨大负担。针对深度学习网络训练的特征提取,高效差异性大的特征在网络训练中表现良好。带有冗余信息的特征在训练时需要消耗更多的资源进行特征学习。所以语谱图应用在深度学习声纹识别方面必须要消除冗余信息,提高网络有效训练效率。
神经网络方法是目前深度学习研究的基础学科,它模拟人的大脑结构由于每个人的说话个性特征无法准确的进行线性表示,随着深度学习逐渐深入各个领域,声纹识别技术方法也逐渐转向深度学习领域进行探索研究。最开始进行该方面研究的学术人员先是利用卷积神经网络(CNN)优秀的特征提取能力来综合性的提取说话人个性表征信息。由于声纹特征的复杂特性,较少层数的CNN网络结构并不能很好的完成识别工作,在此基础上研究人员开始增加网络结构的层数,逐渐用深度神经网络(Deep Neural Networks,DNN)替代CNN的网络提取功能,希望能够在类似声纹这种复杂特征情况准确性能有所提升,并通过实验进行了相关的验证工作。但是随着研究的进行,语音信号中在时序方面也包含有说话人声纹个性信息,但是在以前的研究中都被忽略,在研究中有学者提出使用CNN网络连续语音说话人声纹识别,在有序语谱图的基础上,通过CNN来学习语音中包含的说话人个性特征,但是由于CNN网络的固有特性,对于空间性特征能够较好的提取学习,但是对于时序性特征就表现出较大的局限性。
发明内容
针对上述现有技术的不足,本发明提出了一种基于词嵌入的LSTM网络声纹识别方法,基于词嵌入降维的语谱图特征提取方法,来提高语谱图在网络训练中的有效性,同时利用LSTM网络具有很好的时序特征捕捉能力的特点,采用LSTM网络对词嵌入降维后的语谱图进行分类,实现了高准确率的声纹识别。
本发明采用了如下的技术方案:
一种基于词嵌入的LSTM网络声纹识别方法,包括以下步骤:
S1、获取待识别语音片段;
S2、通过快速傅里叶变换将待识别语音片段的时间刻度、频率和振幅转化,生成待识别语音片段的语谱图;
S3、将待识别语音片段的语谱图通过词嵌入处理进行降维后输入训练后的LSTM网络,得到待识别语音片段的身份分类信息。
优选地,LSTM网络的训练方法包括如下步骤:
S200、获取语音片段训练集及语音片段测试集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910642258.4/2.html,转载请声明来源钻瓜专利网。