[发明专利]一种基于深度残差网络的人群计数方法有效
申请号: | 201611042789.2 | 申请日: | 2016-11-21 |
公开(公告)号: | CN106778502B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 曾令科;徐向民;邢晓芬;青春美;张通 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于深度残差网络的人群计数方法。该方法运用深度残差网络提取人群监控视频中每帧图像的特征,其中深度残差网络的输入为一帧图像,经过一个5x5的核卷积与池化后得到初始特征图,再经过10个残差网络单元提取特征,主分支经过1x1的核卷积获得输入图像对应的人群密度图,辅助分支经过1x1的核卷积获得输入图像对应的人数,最后通过对人群密度图积分获得输入图像的人数估计值。每个残差网络单元结构为:1x1的卷积核后接入3x3的卷积核,再接入1x1的卷积核,每个卷积核后都加入批归一化与线性整流操作,同时上一残差网络单元的输出经过1x1的核卷积也作为下一残差网络单元的输入。本发明能减小场景变换对人群计数的影响,获得稳定的人群计数结果。 | ||
搜索关键词: | 一种 基于 深度 网络 人群 计数 方法 | ||
【主权项】:
一种基于深度残差网络的人群计数方法,其特征在于,包括如下步骤:模型定义阶段,基于静态人群图像训练集训练深度残差网络,设第i张输入图像为Xi,网络参数为W,经过训练后主分支得到人群密度图为f(Xi,W),辅助分支得到人群计数为g(Xi,W),人群密度图为f(Xi,W)和人群计数g(Xi,W)对应地与真实密度图Di及真实人数Yi计算欧式距离,并将欧式距离作为主分支与辅助分支使用的损失函数,使得L(f,Di)与L(g,Yi)达到最小化;所述深度残差网络结构包括一个5x5核卷积层与10个残差单元,主分支经过1x1的核卷积获得输入图像对应的人群密度图,辅助分支经过1x1的核卷积获得输入图像对应的人数,最后通过对人群密度图积分获得输入图像的人数估计值,其中每个残差网络单元结构为:1x1的卷积核后接入3x3的卷积核,再接入1x1的卷积核,每个卷积核后都加入批归一化与线性整流操作,同时上一残差网络单元的输出经过1x1的核卷积也作为下一残差网络单元的输入;训练阶段,主分支与辅助分支使用的损失函数均为网络输出与目标输出的欧式距离,即L(f,Di)=1NΣiN||f(Xi,W)-Di||2]]>L(g,Yi)=1NΣiN||g(Xi,W)-Yi||2]]>其中N为训练集图像总数,按高斯分布每层初始化网络参数W0后,先根据主分支的损失函数L(f,Di)对网络参数进行优化迭代,当L(f,Di)收敛后,根据辅助分支的损失函数L(g,Yi)对网络参数进行优化迭代,当L(g,Yi)收敛后再返回优化主分支,依次交替优化,直至两个分支的损失函数都收敛到设定阈值以下。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611042789.2/,转载请声明来源钻瓜专利网。