[发明专利]一种基于编解码结构的人群计数和密度估计方法在审
申请号: | 202111619982.9 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114445765A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 黄继风;邹敏;姜康;黄子平;陈海光;林晓 | 申请(专利权)人: | 上海师范大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06K9/62;G06N3/04;G06N3/08;G06V10/774;G06V10/82 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200234 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 解码 结构 人群 计数 密度 估计 方法 | ||
1.一种基于编解码结构的人群计数和密度估计方法,其特征在于,该方法包括以下步骤:
A、根据人群拥挤场景的监控视频获取人群图像;
B、根据人群图像构建训练数据集;
C、构建人群计数和密度估计模型;
D、采用训练数据集对人群计数和密度估计模型进行训练;
E、若模型训练的轮次达到设定的迭代值,则保存模型并执行步骤F,否则,返回步骤D;
F、将待预测的人群图像输入训练好的人群计数和密度估计模型中,预测对应的人群数量和密度。
2.根据权利要求1所述的一种基于编解码结构的人群计数和密度估计方法,其特征在于,所述的步骤A具体包括以下步骤:
A1、根据监控设备获取人群拥挤场景的监控视频,并保存至服务器;
A2、将获取的监控视频按照设定的帧数间隔分解成多幅单帧的人群图像保存至服务器中。
3.根据权利要求1所述的一种基于编解码结构的人群计数和密度估计方法,其特征在于,所述的步骤B具体包括以下步骤:
B1、标记人群图像中的人头部,记录人头部在当前图像中的坐标,采用固定高斯核或自适应高斯核方法生成真实的人群密度图,作为人群计数和密度估计模型训练的目标对象;
B2、获取当前图像的分辨率,对图像进行裁剪,并且采用图片水平翻转、随机对比度以及随机亮度的方法扩充训练数据集。
4.根据权利要求3所述的一种基于编解码结构的人群计数和密度估计方法,其特征在于,所述的步骤B2中,对于拥挤场景采用自适应高斯核方法,其他场景采用固定高斯核方法,自适应高斯核方法的具体表达式为:
其中,K为当前人群图像中人头部的总个数,xk表示图像中的第k个人头部坐标,表示距离第k个人头部坐标xk的4个相邻人头部的平均距离,β为常数,σk为高斯核参数,F(x)为生成的人群密度图,当采用固定高斯核方法时,高斯核参数σk则取值常数。
5.根据权利要求1所述的一种基于编解码结构的人群计数和密度估计方法,其特征在于,所述的步骤C中,人群计数和密度估计模型由主干网络、特征融合模块和解码器模块构成,所述的主干网络具体为改进分类型网络InceptionV3,所述的改进分类型网络InceptionV3具体是在原有InceptionV3架构基础上,删除了前五个卷积层中的两个最大池化层以及最底层的最大池化层和全连接层,保留五个inception块里所有的卷积层,所述的主干网络中从前五个卷积层引出第一个输出F1并且分别从第一个、第三个和第五个Inception块引出不同维度的第二个输出F2、第三个输出F3和第四个输出F4,则有:
F1,F2,F3,F4=Backbone(X,θI)
其中,Backbone表示改进的InceptionV3主干网络,X表示输入的人群图像,θI表示主干网络的模型待训练参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111619982.9/1.html,转载请声明来源钻瓜专利网。