[发明专利]一种端到端录音设备源识别方法、识别系统、计算机设备在审
申请号: | 202111313782.0 | 申请日: | 2021-11-08 |
公开(公告)号: | CN114067831A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 曾春艳;冯世雄;王志锋;孔帅;余琰;夏诗言 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L25/51;G06N3/04;G06N3/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 张晓博 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 端到端 录音 设备 识别 方法 系统 计算机 | ||
本发明属于数字音频被动取证技术领域,公开了一种端到端录音设备源识别方法、识别系统、计算机设备,按时序分帧提取数字音频中的梅尔倒谱系数作为设备源特征,再划分为时序特征片段分别提取高斯均值矩阵,得到时序高斯均值矩阵特征;利用卷积神经网络对时序高斯均值矩阵特征进行深度表示学习,提取深度瓶颈特征;通过双向长短期记忆神经网络提取深度时序瓶颈特征中的时域特性,进行录音设备源的识别分类。本发明能够有效的检测区分大量的录音设备型号,并充分考虑到数字音频自身的特殊性,提高了算法的准确度与效率;本发明在进行录音设备源任务时,所需语音数据量小,每条音频文件只需要数秒的长度,不需要特意使用非语音段进行识别。
技术领域
本发明属于数字音频被动取证技术领域,尤其涉及一种基于时序超矢量表示学习的端到端录音设备源识别方法。
背景技术
目前,近十年来,随着电子信息产业的快速发展与进步,智能手机和平板电脑等移动设备得到了广泛普及,音频的录制与存储、传输的便捷性获得极大的提升,录音操作随时随地都可以在移动设备上进行,不再受到需要使用专业录音设备的限制。
在使用智能手机等移动设备进行录音时,所录制的音频以数字音频数据文件的形式保存。通过录音获得的数字音频数据文件中,携带着如语音内容、语言种类、说话人信息、说话人情绪、说话人性别、环境噪声等很多信息,其中也包含着与录音设备相关的信息。在关于语音内容或说话人识别类别的任务中,使用到的特征信息是来自于说话人声音的生物特征,而在录音设备源识别任务中,使用到的特征信息来源于数字信号传输过程中产生的差异性特征。
在使用移动设备录制音频时,由于不同的录音设备内部电路结构与元器件的差异,音频录制过程中产生的语音激励信号在设备电路中的传递会产生差异性,这种差异性造成了不同录音设备在采集语音过程中会在音频文件中留下具有区分性的特征痕迹。
许多研究人员在录音设备源识别领域做了一些包括录音设备聚类、识别等相关工作。在深度学习技术应用到录音设备源识别领域前,通常采用提取音频中的频谱特征如MFCC、LFCC和IMFCC等,然后采用特定的机器学习方法分析特征进行分类。
近年来,由于深度学习技术的快速发展,许多研究人员将深度学习技术应用于录音设备源识别研究领域,录音设备源识别技术获得了快速的发展。深度神经网络具有强大的表示学习能力,可以从原始数据中自动提取高度抽象和复杂的特征,可以自动寻找出与分类任务最相关的特征信息,高效提取出最具区分度的潜在内部特征。CNN(卷积神经网络)和DNN(深度神经网络)已被证明是是录音设备源识别、提取相关特征域空间相关性的有效方法。随着深度学习技术的发展进步,神经网络的发展朝着网络层数越来越高、网络结构越来越复杂的趋势发展,因为深层复杂网络比浅层单一网络有更强的拟合能力,能够提取更多特征,能够解决更加复杂的问题,组合网络对比单一网络展现出了明显的优势。
同时,从特征的角度来看,以往的录音设备源识别方法中,使用的多是MFCC、LFCC和IMFCC等音频中的频谱类短时谱特征,这类特征是从录音数据中直接提取到的声学特征,包含着包括语音内容、环境噪声、说话人信息等与录音设备源识别无关的干扰信息,有研究人员使用GMM(高斯混合模型)方法进一步提取出了更具表达性的高斯超矢量(GaussianSuper Vector,GSV)特征,但是这些特征只使用到了从数据的频域特性中获取到的空间信息,而忽略了连续音频数据中的时域特性,舍弃了录音设备源信号中的时序信息。
近来的录音设备源识别方法的更新与深度学习技术的发展紧密相连,有研究人员使用新的深度学习网络模型与思想对录音设备源识别技术做出了改进,很多优秀的深度网络模型被应用到了录音设备源识别领域。出现了使用循环神经网络类的网络模型应用到录音设备源识别任务中,但在特征方面依旧使用的MFCC等短时频谱特征,对设备源特征信息的表征能力非常有限。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111313782.0/2.html,转载请声明来源钻瓜专利网。