[发明专利]一种针对视频目标分割的注意力引导的对抗性攻击方法在审
申请号: | 202210080615.4 | 申请日: | 2022-01-24 |
公开(公告)号: | CN114494959A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 姚睿;陈莹;周勇;赵佳琦;刘兵;邵志文;祝汉城 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 南京冠誉至恒知识产权代理有限公司 32426 | 代理人: | 黄成萍 |
地址: | 221116 江苏省徐州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 视频 目标 分割 注意力 引导 对抗性 攻击 方法 | ||
1.一种针对视频目标分割的注意力引导的对抗性攻击方法,其特征在于:包括如下步骤:
(1)将视频序列X={x1,x2,…,xn}输入特征提取器Fθ,获取视频帧xi的特征图Fi;其中,θ表示待学习参数,i为视频帧的索引,i=1,2,…,n,n为视频帧的数量;
(2)构建多级特征空间注意力模块,获得特征图Fi的空间注意力图
(3)将空间注意力图与特征图Fi串联起来得到增强特征图Ei,对增强特征图Ei进行下采样得到Ei′;
(4)构建反卷积神经网络,基于下采样后的增强特征图Ei′,生产视频序列X的对抗性扰动ΔX;
(5)将对抗性扰动ΔX添加到视频序列X中产生对抗样本Xadv;
(6)给定初始帧掩码m,将对抗样本Xadv输入单样本视频目标分割网络得到最终预测掩码。
2.根据权利要求1所述的针对视频目标分割的注意力引导的对抗性攻击方法,其特征在于:所述步骤(1)中,特征提取器Fθ采用单样本视频目标分割模型中的VGG16网络,由VGG16网络的最后一个卷积层产生视频帧xi的特征图其中:H、W和C分别表示特征图Fi的高度、宽度和通道数。
3.根据权利要求1所述的针对视频目标分割的注意力引导的对抗性攻击方法,其特征在于:所述步骤(2)中,多级特征空间注意力模块先对特征图Fi进行一个通道维度的平均池化和最大池化,得到两个H×W×1的通道描述;再将这两个通道描述拼接在一起;然后经过一个7×7的卷积层,激活函数为Sigmoid,使用一个Softmax层得到空间注意力图
其中:σ(·)表示Sigmoid函数,f7×7表示一个滤波器大小为7×7的卷积运算;AvgPool(Fi)表示对特征图Fi平均池化,池化结果为MaxPool(Fi)表示对特征图Fi最大池化,池化结果为
4.根据权利要求1所述的针对视频目标分割的注意力引导的对抗性攻击方法,其特征在于:所述步骤(4)中,按照下面的类损失函数训练反卷积神经网络:
其中:表示交叉熵类损失函数,yj是视频帧xi的像素级二进制标签,Y+和Y-是带正负标签的像素,β=|Y-|/|Y+|;
反卷积神经网络使用下面的注意力特征损失函数:
其中:表示哈达玛积,表示视频帧xi的对抗样本,xr是一个随机预定义的特征图;表示通过特征提取器Fθ提取到的的特征图,Fθ(xr)表示通过特征提取器Fθ提取到的xr的特征图,||·||2表示L2范数;
反卷积神经网络采用下面的总损失函数:
其中:λ表示控制噪声和交叉熵损失的重要性权值,μ表示视频帧中目标的重要性权值,ΔX={Δx1,Δx2,…Δxn}表示视频序列X的对抗性扰动,Δxi表示视频帧xi的对抗性扰动。
5.根据权利要求1所述的针对视频目标分割的注意力引导的对抗性攻击方法,其特征在于:所述步骤(5)中,其中:ε是最大允许对抗扰动阈值。
6.根据权利要求1所述的针对视频目标分割的注意力引导的对抗性攻击方法,其特征在于:所述步骤(6)中,将对单样本视频目标分割网络进行的攻击表示为:
其中:Sθ(Xadv,Tτ(Xadv))表示使用对抗样本Xadv进行分割的单样本视频目标分割网络,Tτ(Xadv)表示用于生成对抗样本Xadv中目标感知输出的目标模型,τ表示集成目标模型外观信息编码的参数,τ由对抗样本Xadv的初始帧及其给定的初始帧掩码m确定,利用目标感知输出最终预测掩码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210080615.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于真实年份酒的认证方法及设备
- 下一篇:一种氢化氧化物的制备方法和应用