[发明专利]一种自适应特征融合的智能变电站人体目标跟踪方法在审
申请号: | 202011637615.7 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112669350A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 杨强;张子瑛;彭明洋;陈扬;钱美伊 | 申请(专利权)人: | 广东电网有限责任公司电力科学研究院 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 贾小慧 |
地址: | 510080 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 特征 融合 智能 变电站 人体 目标 跟踪 方法 | ||
1.一种自适应特征融合的智能变电站人体目标跟踪方法,其特征在于,包括:
获取电站现场的人体目标图像,标定获取的人体目标图像,基于ResNet-50深度卷积网络提取特征图;
基于ResNet-50深度卷积网络的C3、C4、C5层级构造特征金字塔网络FPN的P3、P4、P5层级;
将特征金字塔网络FPN的P3、P4、P5层级的特征图输入自适应空间融合ASF进行特征融合;
采用注意力机制增强特征金字塔网络的输出特征图;
将目标图像块z和搜索图像块x分别输入自适应空间融合ASF的共享主干网络f,得到参考特征图f(z)和f(x);将参考特征图f(z)和f(x)进行深度互相关操作,得到候选窗口响应RoWs;
在增强特征金字塔网络的输出特征图上,滑动一组不同比率和不同尺度的锚点,映射到原始图像中得到不同比率和不同尺度的感兴趣区域ROIs;
拼接感兴趣区域ROIs,并将拼接后的ROIs输入三个并联的分支:边界框分支、分类分支和掩膜分支;其中,边界框分支的输出结果,用于下一帧目标的框定,掩膜分支的输出结果用于定位当前帧目标位置;
计算边界框分支的回归损失函数Lbox、分数分支的分类损失函数Lscore和掩膜分支的掩模损失函数Lmask;
计算孪生网络的总体损失函数。
2.根据权利要求1所述的自适应特征融合的智能变电站人体目标跟踪方法,其特征在于,所述基于ResNet-50深度卷积网络提取深度特征信息包括:输入256维的特征图,使用1×1卷积层,将256维的特征转变为64维的特征图;经过ReLU非线性激活后,使用3×3卷积层提取目标特征图;使用ReLU非线性激活,并使用1×1卷积层将目标特征图的维度转为256;将输出的特征图与输入的特征图进行加法操作。
3.根据权利要求2所述的自适应特征融合的智能变电站人体目标跟踪方法,其特征在于,所述将特征金字塔网络的P3、P4、P5的特征图输入自适应空间融合进行特征融合包括:将P3、P4、P5的特征图进行拼接,将拼接后的特征图分为第一分支和第二分支,基于第一分支的特征图得到注意力分支;第二个分支的特征图直接和注意力分支按位相乘;合并第一分支和第二分支,并将第一分支和第二分支合并后的特征图,进行分组和求和操作,得到特征金字塔网络的输出特征图。
4.根据权利要求1-3所述的自适应特征融合的智能变电站人体目标跟踪方法,其特征在于,
采用公式(1)计算边界框分支的回归损失函数Lbox:
其中,smooth L1为:
式中,x为归一化后的距离,i为每组归一化距离的序号;
采用公式(2)计算分数分支的分类损失函数Lscore:
Lscore=-log(pn) (2)
其中,pn表示第n个RoW的置信度分数。
采用公式(3)计算掩膜分支的掩模损失函数Lmask:
其中,n为RoWs的序号,yn为RoW的标签,yn∈{±1},yn=+1表示正标签,yn=-1表示负标签,w,h为第n个RoW真实掩模cn的宽度和高度。为在第n个RoW中,目标的真实掩模在(i,j)像素位置处的正、负标签。为在第n个RoW中,目标的预测掩模在(i,j)像素位置处的正、负标签。
5.根据权利要求4所述的自适应特征融合的智能变电站人体目标跟踪方法,其特征在于,
采用公式(4)计算孪生网络的总体损失函数:
L=λ1Lbox+λ2Lscore+λ3Lmask (4)
其中,λ1,λ2,λ3分别为三个分支损失函数的权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司电力科学研究院,未经广东电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011637615.7/1.html,转载请声明来源钻瓜专利网。