[发明专利]一种基于VGG网络的自动人群计数图像识别方法在审

申请号：	202110028647.5	申请日：	2021-01-11
公开（公告）号：	CN112733714A	公开（公告）日：	2021-04-30
发明（设计）人：	周秉锋;郭德闻;冯洁	申请（专利权）人：	北京大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/08
代理公司：	北京万象新悦知识产权代理有限公司 11360	代理人：	黄凤茹
地址：	100871***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 vgg 网络自动人群计数图像识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公布了一种基于VGG网络的自动人群计数图像识别方法，利用VGG网络模型对图像进行嵌入式层归一化处理，基于VGG网络嵌入式层归一化进行人群计数图像识别，所述自动人群计数图像识别方法命名为VadaLN；包括：建立基于VGG网络模型的嵌入式层归一化网络模型VadaLNet；采用尺度重组网络模块SSM用于进行人群计数，使用散度马尔可夫随机场损失函数DivMRF对人群计数任务建模，并通过对抗式上下文损失函数ACL建立非对齐优化方法，实现密度图估计的非一致训练，优化VadaLNet的参数。本发明方法对输入的包含人群的图像进行识别和人群计数，过滤与计数任务无关的图像特征，即得到VadaLN值，实现基于VGG网络的自动人群计数图像识别。

技术领域

本发明属于图像处理与识别技术领域，涉及自动人群计数图像识别方法，尤其涉及一种基于VGG网络嵌入式层归一化进行人群计数的图像识别方法。

背景技术

人群计数是一种以图像或视频为输入、对拍摄到的人群进行识别和自动人数统计的技术，可用于人流控制、安防、公共安全等多种应用领域。现有的基于深度学习的人群计数方法主要采用两种基本模型。

一种是文献[1](Yingying Zhang,Desen Zhou,Siqin Chen,Shenghua Gao,YiMa.Single-Image Crowd Counting via Multi-Column Convolutional NeuralNetwork.CVPR 2016.)中采用的基于图像处理方法进行图像中的人群计数，在人群实时监测和治安管理中有着广泛的应用。但由于数据量有限，现有方法大多没有考虑到特征域之间的差异，适用性差，因而难以推广应用。

另一种是文献[2](Yuhong Li,Xiaofan Zhang,Deming Chen.CSRNet:DilatedConvolutional Neural Networks for Understanding the Highly CongestedScenes.CVPR 2018.)提出的基于神经网络的解决方案，主要是将数据集中的人群图像和人群标注进行端到端的深度学习，即给定一张人群图像，通过网络模型拟合出其对应的人群密度图，并将密度图中的所有像素值进行累加得到最终的计数结果。但是由于图像中存在颜色、光照、拍摄质量等问题，采用这种方法进行人群计数存在较大的误差，图像质量也会严重影响人群计数的结果。

发明内容

为了克服上述现有技术的不足，本发明提供一种基于VGG网络的自动人群计数图像识别方法，建立基于VGG网络嵌入式层归一化进行人群计数的图像识别方法VadaLN和网络模型VadaLNet，VadaLN是一种采用预训练的“极深卷积神经网络”(VGG)嵌入式层归一化的方法(VGG-Embedded Adaptive Layer Normalization,VadaLN)，将图像的颜色、光照、拍摄质量等信息进行归一化来缓解人群计数的误差，解决目前在单图人群计数方法中，图像质量容易严重影响人群计数结果的问题。

为了使图像中人群计数的结果不受图像质量、颜色和光照的影响，我们提出了基于VGG网络(文献[3]：Karen Simonyan,Andrew Zisserman.Very Deep ConvolutionalNetworks for Large-Scale Image Recognition.ICLR 2015.)的嵌入式自适应层标准化方法VadaLN来过滤与计数任务无关的图像特征。本发明方法VadaLN包括：提出采用尺度重组网络模块(scale-shuffling module,SSM)作为有效部分用于人群计数任务；使用散度马尔可夫随机场损失函数(DivMRF)对计数任务建模；在密度图估计的非一致训练方法中，通过对抗式上下文损失函数(adversarial contextual loss,ACL)建立一种非对齐优化方法。VadaLN在预先训练的VGG-16主干上实现，VadaLN方法不需要额外的学习参数。VadaLN方法将提出的尺度重组网络模块(SSM)合并在一起，以减轻上采样操作中的失真。本发明采用了一种新的归一化方法来减轻训练图像质量变化带来的负面影响。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京大学，未经北京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110028647.5/2.html，转载请声明来源钻瓜专利网。

上一篇：硬馅料夹心饼干生产装置
下一篇：平行链监督共识方法、计算机设备和存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于VGG网络的自动人群计数图像识别方法在审

专利文献下载