[发明专利]一种基于深度残差网络的人群计数方法有效

申请号：	201611042789.2	申请日：	2016-11-21
公开（公告）号：	CN106778502B	公开（公告）日：	2020-09-22
发明（设计）人：	曾令科;徐向民;邢晓芬;青春美;张通	申请（专利权）人：	华南理工大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍
地址：	511458 广东省广州市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种基于深度残差网络的人群计数方法。该方法运用深度残差网络提取人群监控视频中每帧图像的特征，其中深度残差网络的输入为一帧图像，经过一个5x5的核卷积与池化后得到初始特征图，再经过10个残差网络单元提取特征，主分支经过1x1的核卷积获得输入图像对应的人群密度图，辅助分支经过1x1的核卷积获得输入图像对应的人数，最后通过对人群密度图积分获得输入图像的人数估计值。每个残差网络单元结构为：1x1的卷积核后接入3x3的卷积核，再接入1x1的卷积核，每个卷积核后都加入批归一化与线性整流操作，同时上一残差网络单元的输出经过1x1的核卷积也作为下一残差网络单元的输入。本发明能减小场景变换对人群计数的影响，获得稳定的人群计数结果。
搜索关键词：	一种基于深度网络人群计数方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于深度残差网络的人群计数方法，其特征在于，包括如下步骤：模型定义阶段，基于静态人群图像训练集训练深度残差网络，设第i张输入图像为Xi，网络参数为W，经过训练后主分支得到人群密度图为f(Xi,W)，辅助分支得到人群计数为g(Xi,W)，人群密度图为f(Xi,W)和人群计数g(Xi,W)对应地与真实密度图Di及真实人数Yi计算欧式距离，并将欧式距离作为主分支与辅助分支使用的损失函数，使得L(f,Di)与L(g,Yi)达到最小化；所述深度残差网络结构包括一个5x5核卷积层与10个残差单元，主分支经过1x1的核卷积获得输入图像对应的人群密度图，辅助分支经过1x1的核卷积获得输入图像对应的人数，最后通过对人群密度图积分获得输入图像的人数估计值，其中每个残差网络单元结构为：1x1的卷积核后接入3x3的卷积核，再接入1x1的卷积核，每个卷积核后都加入批归一化与线性整流操作，同时上一残差网络单元的输出经过1x1的核卷积也作为下一残差网络单元的输入；训练阶段，主分支与辅助分支使用的损失函数均为网络输出与目标输出的欧式距离，即L(f,Di)=1NΣiN||f(Xi,W)-Di||2]]>L(g,Yi)=1NΣiN||g(Xi,W)-Yi||2]]>其中N为训练集图像总数，按高斯分布每层初始化网络参数W0后，先根据主分支的损失函数L(f,Di)对网络参数进行优化迭代，当L(f,Di)收敛后，根据辅助分支的损失函数L(g,Yi)对网络参数进行优化迭代，当L(g,Yi)收敛后再返回优化主分支，依次交替优化，直至两个分支的损失函数都收敛到设定阈值以下。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201611042789.2/，转载请声明来源钻瓜专利网。

上一篇：基于压缩跟踪与IHDR增量学习的视频人脸在线识别方法
下一篇：一种基于循环帧缓冲区的检测与跟踪的方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度残差网络的人群计数方法有效

专利文献下载