[发明专利]基于卷积神经网络和多任务学习的通用音频隐写分析方法在审
申请号: | 202010415020.0 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111768803A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 王让定;林昱臻;严迪群;董理 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G06N3/04;G06N3/08 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 袁忠卫;李娜 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 任务 学习 通用 音频 分析 方法 | ||
本发明涉及一种基于卷积神经网络和多任务学习的通用音频隐写分析方法,其特征在于:所述方法对应的网络框架包括特征提取子网络、二分类子网络和多分类子网络,通过提供基于卷积神经网络和多任务学习的音频通用隐写分析模型及分析方法,有效地提升了对多种音频隐写算法的检测效果;而且该方法提升了对未知隐写算法的检测能力,便于音频隐写分析技术在复杂互联网大数据取证场景下进行应用。
技术领域
本发明涉及音频隐写技术领域,尤其涉及基于卷积神经网络和多任务学习的通用音 频隐写分析方法。
背景技术
目前基于深度学习技术的音频隐写分析模型已在实验室条件下取得较高的检测性 能。但在实际的网络大数据取证环境下,含密音频可能由多种隐写算法生成,其中可能包含训练数据集中未使用的隐写算法,在此情景下,隐写分析者若直接使用实验室训练 所得模型进行检测,就会造成音频隐写分析中的隐写算法失配(SteganographicAlgorithmMismatch,SAM),准确率将会大打折扣。
SAM发生在含密载体的生成过程中,具体指训练集和测试集中用于生成含密载体的嵌入方法不同。在这种模式下,隐写分析研究者了解载体源的统计特性,仅需要使用 具有相同统计特性的载体数据库来设计和训练分类器,然而,由于不知道隐写算法,训 练阶段含密载体与测试阶段含密载体的特征分布可能有一定差异,如此,即使训练阶段 分类器的检测性能很好,在测试阶段也可能失效。
发明内容
鉴于上述问题,本发明的目的在于提供一种基于卷积神经网络和多任务学习的通用 音频隐写分析方法,该方法能够有效提升音频隐写算法的检测效果以及对未知隐写算法 的检测能力。
为了实现上述目的,本发明的技术方案为:基于卷积神经网络和多任务学习的通用 音频隐写分析方法,其特征在于:所述方法对应的网络框架包括特征提取子网络、二分类子网络和多分类子网络,所述方法包括,
S1,输入音频数据;
S2,通过特征提取子网络输出隐写分析特征向量F;
S3,通过二分类子网络判断音频数据是否为隐写载体,若是,则依次执行S4-S8,若否,则输出音频数据为正常音频;
S4,隐写分析特征向量F经二分类子网络输出得到二元隐写预测概率向量计算二元隐写预测概率向量与One-hot编码后的二 元隐写标签向量y=[y0,y1]的交叉熵损失Lm,其 中yi∈{0,1},i代表类别索引,i∈[0,1],并据此通过反向传播误差与梯度下降算法更新 二分类子网络参数;
S5,隐写分析特征向量F经多分类子网络输出得到隐写算法类型的预测概率值计算预测概率值与 One-hot编码后的隐写类别标签m=[m0,m1,…,mM-1]的交叉熵损失La,其中M代表训练集数据中包含的M类不同隐写算法个数, 并据此通过反向传播误差与梯度下降算法多分类子网络参数;
S6,根据综合损失L=Lm+λLa设置λ,λ为辅助任务权重因子;
S7,通过多分类子网络计算预测概率的置信值C(m);
S8,判断置信值C(m)是否大于设定经验阈值CT,若是,则输出结果为未知隐写算法,若否,则输出隐写算法类型。
进一步的,所述S2中特征提取子网络包括音频预处理层和音频预处理层后的5个级联的卷积组,即第1卷积组、第2卷积组、第3卷积组、第4卷积组、第5卷积组。
进一步的,所述音频预处理层由4个1×5卷积核D1~D4组成,初始权重分别为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010415020.0/2.html,转载请声明来源钻瓜专利网。