[发明专利]一种基于深度残差网络的人群计数方法有效
申请号: | 201611042789.2 | 申请日: | 2016-11-21 |
公开(公告)号: | CN106778502B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 曾令科;徐向民;邢晓芬;青春美;张通 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍 |
地址: | 511458 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 网络 人群 计数 方法 | ||
1.一种基于深度残差网络的人群计数方法,其特征在于,包括如下步骤:
模型定义阶段,基于静态人群图像训练集训练深度残差网络,设第i张输入图像为Xi,网络参数为W,经过训练后主分支得到人群密度图为f(Xi,W),辅助分支得到人群计数为g(Xi,W),人群密度图为f(Xi,W)和人群计数g(Xi,W)对应地与真实密度图Di及真实人数Yi计算欧式距离,并将欧式距离作为主分支与辅助分支使用的损失函数,使得L(f,Di)与L(g,Yi)达到最小化;所述深度残差网络结构包括一个5x5核卷积层与10个残差单元,主分支经过1x1的核卷积获得输入图像对应的人群密度图,辅助分支经过1x1的核卷积获得输入图像对应的人数,最后通过对人群密度图积分获得输入图像的人数估计值,其中每个残差网络单元结构为:1x1的卷积核后接入3x3的卷积核,再接入1x1的卷积核,每个卷积核后都加入批归一化与线性整流操作,同时上一残差网络单元的输出经过1x1的核卷积也作为下一残差网络单元的输入;其中每个残差网络单元包括1x1的卷积核后紧接3x3的卷积核,最后经过1x1的核卷积映射后与上一残差单元输出的特征图经过1x1的核卷积映射后作差运算;经过10个残差网络单元后,主分支经过1x1的核卷积获得密度图Di,辅助分支经过全连接层获得人群数量估计值Y;
训练阶段,主分支与辅助分支使用的损失函数均为网络输出与目标输出的欧式距离,即
其中N为训练集图像总数,按高斯分布每层初始化网络参数W0后,先根据主分支的损失函数L(f,Di)对网络参数进行优化迭代,当L(f,Di)收敛后,根据辅助分支的损失函数L(g,Yi)对网络参数进行优化迭代,当L(g,Yi)收敛后再返回优化主分支,依次交替优化,直至两个分支的损失函数都收敛到设定阈值以下。
2.根据权利要求1所述的基于深度残差网络的人群计数方法,其特征在于,使用10 个连续的残差单元构造人群图像特征提取网络,在残差短路的作用下等效与多个组合式浅层网络的特征融合,实现多尺度特征的提取。
3.根据权利要求1所述的基于深度残差网络的人群计数方法,其特征在于,训练集输入图像Xi对应的真实密度图Di通过以图像中各人头坐标点为中心的二维标准正态分布叠加获得,即
其中G(Xi)为训练集第i张输入图像对应的灰度矩阵,Di为第i张输入图像对应的真实密度图,M为第i张输入图像中的总人数,‖Z‖为单点二维标准正态分布在图像中的加权值,经过归一化操作保证密度图加权值即为人群总数。
4.根据权利要求1所述的基于深度残差网络的人群计数方法,其特征在于,训练网络参数W时,使用随机梯度下降法交替优化主分支与辅助分支,实现局部与全局信息的平衡。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611042789.2/1.html,转载请声明来源钻瓜专利网。