[发明专利]一种基于自注意力机制的行人检索方法有效
申请号: | 202111185768.7 | 申请日: | 2021-10-12 |
公开(公告)号: | CN113920470B | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 韩岑;刘晶晶;刘凯;肖德岐;苏京勋;朱伟;朱华巍;郭星华;王海青 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06N3/04;G06V10/82;G06V40/10;G06V40/20 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
地址: | 210046 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 行人 检索 方法 | ||
1.一种基于自注意力机制的行人检索方法,其特征在于,包括以下步骤:
步骤1,以包含行人的监控视频图像作为输入,通过卷积神经网络检测所述监控视频图像中的所有行人,得到行人检测框和每个所述行人对应的卷积特征图,并计算行人检索任务中的子任务,即计算行人检测损失;
步骤2,根据所述卷积特征图,通过基于自注意力机制的行人特征精细化模块,将所述卷积特征图水平分割,在获得的每一个分割块中提取行人关键点,并将所述行人关键点所对应的区域转化为空间自注意力,结合通道自注意力,在所述每一个分割块上,得到行人辨识度更加突出的特征向量,针对所述每一个分割块计算空间自注意力损失;
步骤3,以所述卷积特征图作为输入,生成分类置信度向量,进行随机标签选择,根据随机选择后的标签进行标签平滑,计算随机标签平滑损失;
步骤4,对所述步骤1至步骤3计算获得的所有损失函数求和,将求和结果作为基于自注意力机制的行人检索框架的总损失,以最小化所述总损失为目标,更新所述基于自注意力机制的行人检索框架中的所有参数;
步骤5,基于所述自注意力机制的行人检索框架,在确定目标行人图H后,以待检索的监控视频图像作为输入,判断所述待检索的监控视频图像中是否存在目标行人,若存在则输出行人检索结果,即通过所述行人检测框标记出目标行人在待检索的监控视频画面中的位置。
2.根据权利要求1所述的一种基于自注意力机制的行人检索方法,其特征在于,所述步骤1,包括:
针对输入的行人图像集,即所述包含行人的监控视频图像,采用Faster R-CNN算法检测所述监控视频图像中的所有行人,得到所述行人检测框、整张所述监控视频图像的卷积特征图以及每个行人对应的卷积特征图,所述每个行人对应的卷积特征图即:
Fi∈RW*H*C,i=1…n
其中,Fi表示每个行人对应的卷积特征图,i表示行人序号,R表示行人卷积特征图集,W,H,C分别代表每个行人对应的卷积特征图的宽度、高度和通道数,n表示检测到的监控视频图像中的行人个数;
以Faster R-CNN算法中描述的Softmax损失函数和Smooth L1损失函数计算行人检索任务中的子任务,即计算所述行人检测损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111185768.7/1.html,转载请声明来源钻瓜专利网。