[发明专利]基于卷积神经网络和多任务学习的通用音频隐写分析方法在审
申请号: | 202010415020.0 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111768803A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 王让定;林昱臻;严迪群;董理 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/30;G06N3/04;G06N3/08 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 袁忠卫;李娜 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 任务 学习 通用 音频 分析 方法 | ||
1.一种基于卷积神经网络和多任务学习的通用音频隐写分析方法,其特征在于:所述方法对应的网络框架包括特征提取子网络、二分类子网络和多分类子网络,所述方法包括,
S1,输入音频数据;
S2,通过特征提取子网络输出隐写分析特征向量F;
S3,通过二分类子网络判断音频数据是否为隐写载体,若是,则依次执行S4-S8,若否,则输出音频数据为正常音频;
S4,隐写分析特征向量F经二分类子网络输出得到二元隐写预测概率向量计算二元隐写预测概率向量与One-hot编码后的二元隐写标签向量y=[y0,y1]的交叉熵损失Lm,其中yi∈{0,1},i代表类别索引,i∈[0,1],并据此通过反向传播误差与梯度下降算法更新二分类子网络参数;
S5,隐写分析特征向量F经多分类子网络输出得到隐写算法类型的预测概率值计算预测概率值与One-hot编码后的隐写类别标签m=[m0,m1,…,mM-1]的交叉熵损失La,其中M代表训练集数据中包含的M类不同隐写算法个数,并据此通过反向传播误差与梯度下降算法多分类子网络参数;
S6,根据综合损失L=Lm+λLa设置λ,λ为辅助任务权重因子;
S7,通过多分类子网络计算预测概率的置信值C(m);
S8,判断置信值C(m)是否大于设定经验阈值CT,若是,则输出结果为未知隐写算法,若否,则输出隐写算法类型。
2.根据权利要求1所述基于卷积神经网络和多任务学习的通用音频隐写分析方法,其特征在于:
所述S2中特征提取子网络包括音频预处理层和音频预处理层后的5个级联的卷积组,即第1卷积组、第2卷积组、第3卷积组、第4卷积组、第5卷积组。
3.根据权利要求2所述基于卷积神经网络和多任务学习的通用音频隐写分析方法,其特征在于:
所述音频预处理层由4个1×5卷积核D1~D4组成,初始权重分别为:
D1=[1,-1,0,0,0],D1=[1,-2,1,0,0],D1=[1,-3,3,1,0],D1=[1,-4,6,-4,1];
所述第1卷积组包括1×1的第一卷积层、1×5的第二卷积层和1×1的第三卷积层;
所述第2卷积组、第3卷积组、第4卷积组、第5卷积组均包含一个1×5卷积层、1×1卷积层和均值池化层,其中第5卷积组的均值池化层为全局均值池化层;
所述隐写分析特征向量为256维向量。
4.根据权利要求3所述基于卷积神经网络和多任务学习的通用音频隐写分析方法,其特征在于:
所述音频预处理层采用差分滤波设计。
5.根据权利要求3所述基于卷积神经网络和多任务学习的通用音频隐写分析方法,其特征在于:
所述第1卷积组中的第一卷积层采用截断线性单元TLU激活。
6.根据权利要求1所述基于卷积神经网络和多任务学习的通用音频隐写分析方法,其特征在于:
所述二分类子网络包括具有128个神经元的全连接层和二元隐写标签预测层。
7.根据权利要求1所述基于卷积神经网络和多任务学习的通用音频隐写分析方法,其特征在于:
所述多分类子网络包括两层级联的全连接层和隐写类别标签预测层,级联的两层分别具有128个神经元和64个神经元。
8.根据权利要求1所述基于卷积神经网络和多任务学习的通用音频隐写分析方法,其特征在于:
所述S8中置信值C(m)的计算公式为设定经验阈值CT=0.5*C(m)max,其中C(m)max=logM。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010415020.0/1.html,转载请声明来源钻瓜专利网。