[发明专利]一种基于卷积神经网络的移动设备源识别方法及系统在审
申请号: | 201811229837.8 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109378014A | 公开(公告)日: | 2019-02-22 |
发明(设计)人: | 王志锋;湛健;刘清堂;赵刚;田元;魏艳涛;姚璜;邓伟;夏丹 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G10L25/45;G06N3/04;G06N3/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 移动设备 源识别 数据运算量 自适应算法 特征训练 训练语音 语音片段 语音数据 自动识别 泛化性 样本量 建模 音调 音素 运算 噪声 取证 语音 筛选 分类 保证 | ||
本发明属于语音取证技术领域,公开了一种基于卷积神经网络的移动设备源识别方法及系统,先提取训练语音片段的MFCC特征训练一个GMM‑UBM模型,然后再基于特定的带噪声的语音片段提取MFCC特征,进而调整GMM的参数,最后将提取到的特征用来训练卷积神经网络,达到自动识别分类的要求。本发明在训练GMM‑UBM模型时,根据语音数据音素和音调的特点对数据进行筛选,挑选出具有代表性的少量数据,即保证了模型的表征泛化性也降低了数据运算量,提高了建模了效率;首先训练一个GMM‑UBM模型,然后再用MAP自适应算法来调整GMM的参数,克服了样本量少,无法训练GMM模型的问题,同时加快了运算速度。
技术领域
本发明属于语音取证技术领域,尤其涉及一种基于卷积神经网络的移动设备源识别方法及系统。
背景技术
目前,业内常用的现有技术是这样的:
设备源识别是基于对录音设备信道估计的检测方法,近年来,随着信息技术发展,数字音频数据的来源变得十分方便,数字音频取证技术也日益受到广泛的关注,特别是在司法领域有着重要的应用需求。对设备信道的检测主要是基于设备源的噪声特征,噪声有加性噪声和乘积噪声即卷积噪声的区分,在语音产生过程中,信道中会伴随着产生卷积噪声,因此,卷积噪声可以作为对信道信息估计得依据,进而可以用来判断录音信息的来源。
而目前大多数技术都是先对语音信号进行预处理去噪、加窗、分帧、提取静音段,然后提取语音信号的深层特征,通常使用的是MFCC特征、LPCC特征等,这类特征需要能够很好的反应出设备的信道特征,再经过一系列的运算,例如求平均对数谱、RASTA滤波,最后输入到分类器训练模型、测试数据。常用的是分类器是SVM。
随着机器学习一系列的算法被提出,机器学习也日益成为人们心目中做分类识别的利器,从识别精度上来分析,已经远远超过了认为识别的效果,而且在数据处理能力和计算量上也大大优于传统方法。
综上所述,现有技术存在的问题是:
(1)目前对于特征信息的判决,常用的机器学习判决器是SVM,SVM判决器基于距离向量寻找到合适的超平面,然后对分布在不同空间的数据进行分类判决。在寻找这类超平面的过程中,需要到更高的维度去寻找超平面,因此给运算带来了很多的不便,降低了运算的速度,同时也降低了识别的精确度。
(2)目前对于移动设备源识别研究的数据集设备个数相对比较少,而在本方案中使用的设备源个数为21类,增加了本方案的技术难度。
(3)本方案中使用的特征是高斯超矢量,高斯超矢量是通过一系列的高斯模型提取到的特征数据,因此它对样本的表征性会更强,相较于传统的梅尔倒谱稀疏,线性预测倒谱系数的特征,其适用范围更广泛,精度更高。
解决上述技术问题的难度和意义:
难度在于,现有技术中,不能克服训练多元GMM模型需要大量数据的弊端。
卷积网络属于机器学习范畴里面的深度学习。近几年随着深度学习的发展,各种优良的激活函数被提出,网络结构的进一步优化也使得深度学习网络的性能进一步得到了提高,深度学习的神经网络更细致的提取到了特征的隐含表征信息,对数据的分类识别提供了一个很好的方法。相较于传统的机器学习算法如SVM,决策树等,卷积神经网络的性能将会更加优良,但是随之而来的数据运算量也会相对增加。
解决现有技术问题后,带来的意义为:
随着科技的发展,语音数据的来源越来越方便,给人们的生活带来了便利,但同时也给一些分子提供了可乘之机。在司法方面,语音数据作为证据显得越来越重要,但一些不法分子为了逃脱法律的惩罚,伪造、篡改语音数据以隐瞒真相,因此给办案人员带来很多的麻烦。本方案为解决语音数据来源取证问题提供了可执行高效的方案。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811229837.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音降噪方法
- 下一篇:一种语音学习系统及方法