[发明专利]基于卷积神经网络和领域对抗学习的音频隐写分析方法在审
申请号: | 202010415018.3 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111768792A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 王让定;林昱臻;严迪群;董理 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L19/018 | 分类号: | G10L19/018;G10L25/30;G10L19/06 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 袁忠卫;李娜 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 领域 对抗 学习 音频 分析 方法 | ||
本发明涉及一种基于卷积神经网络和领域对抗学习的音频隐写分析方法,其特征在于:所述方法对应的网络框架包括特征提取子网络隐写分析子网络和载体来源判别子网络其中θf、θy、θd分别代表各个子网络的网络参数,通过提供基于卷积神经网络和领域对抗学习的音频隐写分析方法,能有效缓解由载体来源失配问题导致的音频隐写分析模型性能下降问题,为音频隐写分析技术在复杂互联网大数据取证场景下的应用提供了一种可行思路。
技术领域
本发明涉及音频隐写技术领域,尤其涉及基于卷积神经网络和领域对抗学习的音频 隐写分析方法。
背景技术
目前基于深度学习技术的音频隐写分析模型已在实验室条件下取得较高的检测性 能。但在实际的网络大数据取证环境下,音频载体数据存在着多样性和异质性等特点,如果直接用实验室训练所得的隐写分析模型进行检测,准确率将会大打折扣。
音频隐写分析中的载体来源失配(Cover Source Mismatch,CSM)问题,是由训练集音频数据和测试集音频数据的来源(如录音设备、说话人性别、语言等因素)不同造 成的。CSM在本质上是迁移学习中的领域自适应(Domain Adaptation)问题,领域自适 应问题可以定义为:给定一个有标记的源数据领域和一个无标记的目标数 据领域假定它们的特征空间相同,类别空间相同以及条件概率分布也相 同,但这两个域的边缘分布不同,则领域自适应学习的目标就是,利用有标记的数据Ds去学习一个分类器f:xt→yt来预测目标域Dt的标签,使得预测的错误风险最小。
但目前并没有专门针对音频隐写分析中CSM问题的解决方法。
发明内容
鉴于上述问题,本发明的目的在于提供一种基于卷积神经网络和领域对抗学习的音 频隐写分析方法,该方法能够有效缓解CSM现象对音频隐写分析模型性能下降的影响,提高了音频隐写分析技术在复杂互联网大数据取证场景下的应用可行性。
为了实现上述目的,本发明的技术方案为:基于卷积神经网络和领域对抗学习的音 频隐写分析方法,其特征在于:所述方法对应的网络框架包括特征提取子网络隐写分析子网络和载体来源判别子网络其中θf、θy、θd分别代表各个子网络的 网络参数,所述方法包括,
S1,输入源域数据目标域数据对抗训练因子λ、学习率η;
S2,通过特征提取子网络输出隐写分析特征向量F;
S3,隐写分析特征向量F经隐写分析子网络输出得到二元隐写预测概率计算二元隐写预测概率与原始隐写标签y的交叉熵损失ly,并据此通过反向传播误差与梯度 下降算法更新网络参数θy,其中y∈{0,1},当y取值0时代表原始载体而取值1时代 表隐写载体;
S4,隐写分析特征向量F经载体来源判别子网络输出得到载体来源预测概率值计算载体来源预测概率值与原始隐写标签d的交叉熵损失ld,并据此通过反向传播误 差更新网络参数θd,其中d∈{0,1},当d取值0时代表源域而取值1时代表目标域。
进一步的,所述S2中特征提取子网络包括音频预处理层和音频预处理层后的4个级联的卷积组,即第1卷积组、第2卷积组、第3卷积组、第4卷积组。
进一步的,所述音频预处理层由4个1×5卷积核D1~D4组成,初始权重分别为:
D1=[1,-1,0,0,0],D1=[1,-2,1,0,0],D1=[1,-3,3,1,0],D1=[1,-4,6,-4,1];
所述第1卷积组包括1×1的第一卷积层、1×5的第二卷积层和1×1的第三卷积层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010415018.3/2.html,转载请声明来源钻瓜专利网。