[发明专利]一种基于注意力机制动态融合卷积网络的人群计数方法在审
申请号: | 202111334103.8 | 申请日: | 2021-11-11 |
公开(公告)号: | CN114091588A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 王勇杰;朱江华;张红亮 | 申请(专利权)人: | 中国电子科技集团公司第五十四研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06T5/00;G06T7/00;G06V10/46;G06V10/764;G06V10/80 |
代理公司: | 河北东尚律师事务所 13124 | 代理人: | 王文庆 |
地址: | 050081 河北省石家庄市中*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 动态 融合 卷积 网络 人群 计数 方法 | ||
1.一种基于注意力机制动态融合卷积网络的人群计数方法,其特征在于,包括以下步骤:
(1)构建带有标注和标签的图片数据集;
(2)采用图片数据集训练深度卷积神经网络;所述深度卷积神经网络基于分类网络VGG16进行修改,添加二分支结构,变成二分支融合网络;其中,大卷积核分支对应提取人群图像近景特征,小卷积核分支对应提取人群图像远景特征,每个分支结构的末尾都采用注意力机制进行强化学习,生成人群密度分布图;最后采用动态融合方法对二分支结构生成的人群密度估计图进行融合,得到最终的人群密度图,再积分获得人群总数;
(3)通过交叉验证的方式,选择不同的测试集进行测试,统计测试结果并做相关分析,计算深度卷积神经网络的人群计数正确率,不断调整神经网络参数,直至达到最优的估计效果,完成神经网络模型的构建;
(4)采用步骤(3)中构建好的神经网络模型进行人群计数。
2.根据权利要求1所述的一种基于注意力机制动态融合卷积网络的人群计数方法,其特征在于,步骤(1)的具体方式为:
(101)获取人群图片,采用高斯核函数的方法,对图片中的行人头部位置进行标记,各图片按照原始大小生成标注数据集;
(102)通过加入图像噪声、图像模糊化、改变图像明暗度、调整图像质量的方式进行图像增强,扩充图片数据集。
3.根据权利要求1所述的一种基于注意力机制动态融合卷积网络的人群计数方法,其特征在于,步骤(2)的具体方式为:
(201)训练神经网络生成人群密度图:对VGG16网络进行修改,将分类网络变成人群密度估计网络,保留VGG16网络的前13层卷积层作为特征提取层,去掉VGG16的全连接层,添加二分支结构;其中,第一个分支由5层卷积层组成,利用大卷积核的卷积层继续提取特征;第二个分支由3层卷积层组成,利用小卷积核的卷积层继续提取特征;在每个分支的末尾均利用注意力机制强迫神经网络学习图像中人群头部特征,最后利用动态融合算法对提取的特征进行融合,生成人群密度估计图;
(202)获得人群总数:对生成的人群密度估计图进行积分,获得人群总数;整个神经网络使用交叉熵损失函数和L2-Loss损失函数的组合作为最终的损失函数;
训练时,计算所有图像的均值文件,将各训练图像减去均值文件,再输入到深度卷积神经网络中,经过前向传导、反向传导后即更新一次网络的参数权重,经过多次迭代之后,得到训练好的卷积神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所,未经中国电子科技集团公司第五十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111334103.8/1.html,转载请声明来源钻瓜专利网。