[发明专利]一种基于VGG网络的自动人群计数图像识别方法在审
申请号: | 202110028647.5 | 申请日: | 2021-01-11 |
公开(公告)号: | CN112733714A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 周秉锋;郭德闻;冯洁 | 申请(专利权)人: | 北京大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/08 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 vgg 网络 自动 人群 计数 图像 识别 方法 | ||
本发明公布了一种基于VGG网络的自动人群计数图像识别方法,利用VGG网络模型对图像进行嵌入式层归一化处理,基于VGG网络嵌入式层归一化进行人群计数图像识别,所述自动人群计数图像识别方法命名为VadaLN;包括:建立基于VGG网络模型的嵌入式层归一化网络模型VadaLNet;采用尺度重组网络模块SSM用于进行人群计数,使用散度马尔可夫随机场损失函数DivMRF对人群计数任务建模,并通过对抗式上下文损失函数ACL建立非对齐优化方法,实现密度图估计的非一致训练,优化VadaLNet的参数。本发明方法对输入的包含人群的图像进行识别和人群计数,过滤与计数任务无关的图像特征,即得到VadaLN值,实现基于VGG网络的自动人群计数图像识别。
技术领域
本发明属于图像处理与识别技术领域,涉及自动人群计数图像识别方法,尤其涉及一种基于VGG网络嵌入式层归一化进行人群计数的图像识别方法。
背景技术
人群计数是一种以图像或视频为输入、对拍摄到的人群进行识别和自动人数统计的技术,可用于人流控制、安防、公共安全等多种应用领域。现有的基于深度学习的人群计数方法主要采用两种基本模型。
一种是文献[1](Yingying Zhang,Desen Zhou,Siqin Chen,Shenghua Gao,YiMa.Single-Image Crowd Counting via Multi-Column Convolutional NeuralNetwork.CVPR 2016.)中采用的基于图像处理方法进行图像中的人群计数,在人群实时监测和治安管理中有着广泛的应用。但由于数据量有限,现有方法大多没有考虑到特征域之间的差异,适用性差,因而难以推广应用。
另一种是文献[2](Yuhong Li,Xiaofan Zhang,Deming Chen.CSRNet:DilatedConvolutional Neural Networks for Understanding the Highly CongestedScenes.CVPR 2018.)提出的基于神经网络的解决方案,主要是将数据集中的人群图像和人群标注进行端到端的深度学习,即给定一张人群图像,通过网络模型拟合出其对应的人群密度图,并将密度图中的所有像素值进行累加得到最终的计数结果。但是由于图像中存在颜色、光照、拍摄质量等问题,采用这种方法进行人群计数存在较大的误差,图像质量也会严重影响人群计数的结果。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于VGG网络的自动人群计数图像识别方法,建立基于VGG网络嵌入式层归一化进行人群计数的图像识别方法VadaLN和网络模型VadaLNet,VadaLN是一种采用预训练的“极深卷积神经网络”(VGG)嵌入式层归一化的方法(VGG-Embedded Adaptive Layer Normalization,VadaLN),将图像的颜色、光照、拍摄质量等信息进行归一化来缓解人群计数的误差,解决目前在单图人群计数方法中,图像质量容易严重影响人群计数结果的问题。
为了使图像中人群计数的结果不受图像质量、颜色和光照的影响,我们提出了基于VGG网络(文献[3]:Karen Simonyan,Andrew Zisserman.Very Deep ConvolutionalNetworks for Large-Scale Image Recognition.ICLR 2015.)的嵌入式自适应层标准化方法VadaLN来过滤与计数任务无关的图像特征。本发明方法VadaLN包括:提出采用尺度重组网络模块(scale-shuffling module,SSM)作为有效部分用于人群计数任务;使用散度马尔可夫随机场损失函数(DivMRF)对计数任务建模;在密度图估计的非一致训练方法中,通过对抗式上下文损失函数(adversarial contextual loss,ACL)建立一种非对齐优化方法。VadaLN在预先训练的VGG-16主干上实现,VadaLN方法不需要额外的学习参数。VadaLN方法将提出的尺度重组网络模块(SSM)合并在一起,以减轻上采样操作中的失真。本发明采用了一种新的归一化方法来减轻训练图像质量变化带来的负面影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110028647.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:硬馅料夹心饼干生产装置
- 下一篇:平行链监督共识方法、计算机设备和存储介质