[发明专利]一种基于卷积神经网络的移动设备源识别方法及系统在审
申请号: | 201811229837.8 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109378014A | 公开(公告)日: | 2019-02-22 |
发明(设计)人: | 王志锋;湛健;刘清堂;赵刚;田元;魏艳涛;姚璜;邓伟;夏丹 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G10L25/45;G06N3/04;G06N3/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 移动设备 源识别 数据运算量 自适应算法 特征训练 训练语音 语音片段 语音数据 自动识别 泛化性 样本量 建模 音调 音素 运算 噪声 取证 语音 筛选 分类 保证 | ||
1.一种基于卷积神经网络的移动设备源识别方法,其特征在于,所述基于卷积神经网络的移动设备源识别方法包括:
提取训练语音片段的MFCC特征训练GMM-UBM模型;
再基于特定的带噪声的语音片段提取MFCC特征,调整GMM的参数;
将提取到的特征训练卷积神经网络,进行自动识别分类。
2.如权利要求1所述的基于卷积神经网络的移动设备源识别方法,其特征在于,所述基于卷积神经网络的移动设备源识别方法具体包括:
步骤一:对训练语音信号预处理提取特征信息;
步骤二:利用训练的语音训练GMM-UBM模型;
步骤三:对目标语音信号预处理提取特征信息;
步骤四:计算目标手机语音信号特定的GMM模型;
步骤五:提取高斯分量;
步骤六:训练卷积神经网络并测试模型。
3.如权利要求2所述的基于卷积神经网络的移动设备源识别方法,其特征在于,步骤一具体包括:
步骤1.1:对训练语音信号进行筛选;
步骤1.2:对训练的语音信号进行短时傅里叶变换;
步骤1.3:对步骤1.2中频域信号提取MFCCs特征;
步骤二具体包括;
步骤2.1:用步骤1.3中得到的MFCCs特征训练GMM-UBM模型;
步骤三具体包括:
步骤3.1:对目标语音进行短时傅里叶变换;
步骤3.2:对步骤3.1中频域信号提取MFCCs特征;
步骤四具体包括:
步骤4.1:将步骤3.2中得到的MFCCs特征通过步骤1.3所训练好的GMM模型和MAP算法调整GMM模型参数;
步骤五具体包括:
步骤5.1:把步骤4.1中训练好的每一个GMM模型的均值参数提取出来作为特征信号;
步骤六具体包括:
步骤6.1:将特征数据分为训练数据和测试数据两类;
步骤6.2:将特征数据分进行标注分类,标注使用one-hot编码;
步骤6.3:将特征数据进行预处理;
步骤6.4:将训练数据用来训练构建好的卷积神经网络;
步骤6.5:使用测试数据对已训练好的网络进行测试评估。
4.如权利要求3所述的基于卷积神经网络的移动设备源识别方法,其特征在于,步骤一进一步包括:
对训练的语音信号加窗分帧进行预处理,然后进行短时傅里叶变换;加窗的窗长设为256,帧移为128,然后进行傅里叶变换;
对中频域信号提取MFCCs特征,首先提取语音信号的MFCC特征,选择12个系数再加上F0的能量,同时保留一阶和二阶的系数,总共39维数据;
步骤二进一步包括:先训练最基本的录音GMM模型作为通用背景模型UBM;一个具有M个高斯,特征数据为D维的GMM模型表示为如下形式:
式中x为输入的N*D维的特征矢量。λ={wi,ui,∑i},wi为高斯混合模型的权重,且满足最终得到的参数大小为D*1维。ui为每个高斯分量的均值,大小为M*D维;Σi为每个高斯分量的方差,大小为M*D维;Pi(x)为每个高斯模型的概率密度,且满足
(x-ui)-1为(x-ui)的转置,|Σi|和(Σi)-1为Σi的行列式和逆矩阵,使用EM算法训练GMM-UBM模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811229837.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音降噪方法
- 下一篇:一种语音学习系统及方法