[发明专利]一种新的人群计数方法在审
申请号: | 202310366285.X | 申请日: | 2023-04-07 |
公开(公告)号: | CN116363594A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 张红英;曾芸芸;蒲俊涛 | 申请(专利权)人: | 西南科技大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/82;G06V10/80;G06V10/774;G06V10/40;G06T7/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 621010 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人群 计数 方法 | ||
1.一种新的人群计数方法,其特征在于网络模型设计两个分支进行深层特征提取,分支1加入了融合注意力机制金字塔结构,分支2加入双通道注意力模块,设计残差过渡块block进行特征融合,设计过渡模块提取深层二维信息以及在模型训练时加入了联合损失函数5个特点;其中包括对数据集进行预处理、对图像进行特征提取与融合、对融合后的特征张量生成密度图、对密度图进行积分得到人群数量、对网络进行训练与测试五个部分:
第一部分包括两个步骤
步骤1,首先下载人群计数ShanghaiTech PartB,UCF-QNRF,UCF-CC-50数据集,其中标签格式均为.mat,mat文件里面记录了每个注释人头的二维坐标和总人头数量。根据数据集里的标注生成真值密度图,首先构造一个和原始图片大小相同的矩阵,并将其全部置0,然后将每个被标记的人头对应的位置置1,这样就得到了一个只有0和1的矩阵,最后通过高斯核函数进行卷积得到一个连续的密度图;
步骤2,将数据集的图片随机裁剪1/4作为训练图像,并将图像经旋转,平移基础操作,增强训练样本集,形成最终的训练集样本;
第二部分包括三个步骤:
步骤3,将步骤2中的训练样本输入以VGG19前16层组成的骨干网,通过通道数变换从RGB空间初步得到特征张量A;
步骤4,对步骤3得到的特征张量A分别送入分支1,分支2;分支1中,特征张量A通过金字塔结构得到特征张量B1、B2、B3、B4、B5,其中B1是经过1×1卷积得到的特征张量,B2、B3、B4是经过三个不同的膨胀卷积得到的特征张量,B5是经过全局池化得到的特征张量;将特征张量B2、B3、B4送入自注意力模块得到特征张量C1、C2、C3,再将特征张量C1、C2、C3、B1、B5进行拼接得到特征张量D,最后将特征张量D送入到有两个卷积级联的残差过渡块block得到分支1最终的特征张量E;
步骤5,分支2中,特征张量A通过双通道注意力模块得到特征张量F;将分支1得到的特征张量E与分支2得到的特征张量F进行拼接得到特征张量G,将G送入残差过渡块block得到融合后的特征张量H;
第三部分包括一个步骤:
步骤6,将步骤5中得到的特征张量H经三个卷积块级联的过渡模块处理提取深层二维信息并变换通道得到最终的特征图I,最后特征图I经1×1卷积得到预测密度图图7;
第四部分包括一个步骤:
步骤7,将步骤6得到的预测密度图进行求和得到最后的人群数量;
第五部分包括三个步骤:
步骤8,在训练中,联合使用欧式距离损失函数L2和L1;
步骤9,调试从步骤3到步骤6的网络结构超参数,并得到最终的训练模型;
步骤10,将步骤1中测试集输入到步骤9中的训练模型,得到最终的密度图。
2.根据权利要求1所述的一种新的人群计数方法,其特征在于,步骤4中融合注意力机制的多尺度特征提取模块和加入双通道注意力模型的双分支结构,准确定位不同尺度的目标,描绘任意两个位置的空间依赖性,使模型学习关注到重要区域的能力。
3.根据权利要求1所述的一种新的人群计数方法,其特征在于,步骤4中设计的残差过渡块block,该模块采用残差结构动态调整模型复杂度且变换通道数,对提取的特征进行融合回归。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南科技大学,未经西南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310366285.X/1.html,转载请声明来源钻瓜专利网。