[发明专利]一种基于多尺度密度图融合空洞卷积的人群计数方法有效

申请号：	202010167699.6	申请日：	2020-03-11
公开（公告）号：	CN111507183B	公开（公告）日：	2021-02-02
发明（设计）人：	汤景凡;周美佳;姜明;李鹏飞;张旻	申请（专利权）人：	杭州电子科技大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08
代理公司：	杭州君度专利代理事务所(特殊普通合伙) 33240	代理人：	朱月芬
地址：	310018 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于尺度密度融合空洞卷积人群计数方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多尺度密度图融合空洞卷积的人群计数方法，其特征在于包括以下步骤：

步骤(1)获取人群图像数据集，并且进行预处理；

步骤(2)建立基于多尺度密度图融合空洞卷积的人群计数网络；

步骤(3)将预处理之后的人群图像输入该人群计数网络中提取特征数据，输出对应图像的低分辨率密度图；

步骤(4)将低分辨率密度图融合空洞卷积网络，输出对应图像的高分辨率密度图；

步骤(5)对人群计数网络输出的高分辨率密度图进行积分，得到对应人群图像中的人群总数；

步骤(6)将最后输出的高分辨率密度图与人工标注的真实密度图进行损失计算，不断迭代更新人群计数网络；

步骤(7)将测试图片输入最终确认的人群计数网络，生成人群分布密度图并且进行人群计数；

步骤(1)具体过程如下：

(1-1)从网上获取本领域的多个公开数据集，对每个数据集分别进行整理归类，随机抽选出所需数量的图片作为训练集，剩下的作为测试集；

(1-2)将整理出的训练集进行二值化、归一化、数据增强的预处理，消除图像中的无关信息，输入人群图像的训练集表示为P＝{p₁,p₂…p_n}，其中n表示为训练集大小；

步骤(2)具体过程如下：

(2-1)构建基于多尺度密度图融合空洞卷积的人群计数网络，确定网络的广度、深度和训练方式；

(2-2)该人群计数网络由主干和分支两部分构成，其中分支生成三个含有不同空间关联信息的低分辨率密度图，主干用于将三个含有不同语义信息的低分辨率密度图融合空洞卷积生成高分辨率密度图；

(2-3)通过网络训练每一张图片，生成对应的低分辨率密度图B_i和高分辨率密度图h_i，构成一个三元组集合，D＝{(p₁,B₁,h₁)…(p_n,B_n,h_n)}，其中p_i是第i个输入图像，B_i是第p_i对应的低分辨率密度图，h_i是p_i对应的高分辨率密度图，n表示训练集大小；

步骤(3)具体过程如下：

(3-1)从步骤(1)的数据集中获取预处理后的训练集P＝{p₁,p₂…p_n}，输入人群计数网络中；

(3-2)在人群计数网络的主干网络前端提取出三个不同深度的特征向量，分别输入分支中的三条子分支进一步提取语义信息，输出对应的低分辨率密度图B_i＝{b_i1,b_i2…b_i3}，将低分辨率密度图作为高分辨率密度图预测任务的重要特征，b_ij是第i个输入图像对应的第j条子分支的低分辨率密度图,1≤j≤3；

(3-3)对输入图像进行映射，映射函数为：α_l为低分辨率密度图对应的子分支的参数；p_i表示第i个输入图像；f_l()表示映射函数,反映了低分辨率密度图分支的一系列卷积操作过程；表示人群计数网络得出的低分辨率密度图；

步骤(4)具体过程如下：

(4-1)基于步骤(3-1)，在人群计数网络的主干网络后端构建空洞卷积神经网络，在图像不同大小的感受野上进一步提取关键特征；假设特征输出为y，则y_i表示第i个图像于空洞卷积的特征输出，卷积核为k，空洞率为d，则空洞卷积操作如下：

y_i＝∑_dx_[i+r*d]k[d]；

其中，r表示空洞卷积核的步长，即卷积核的间隔数量，普通的卷积是空洞卷积的一个特殊情况，当r＝1的时候，即是普通的卷积核，通过设置不同的步长r来获得不同大小的感受野；x_i+r*d表示第i个图像于空洞卷积的特征输入；

(4-2)融合低分辨率密度图输出最终的高分辨率密度图

为第i张图片对应的高分辨率密度图，f_h()为高分辨率的映射函数，反映了生成高分辨率密度图时的一系列卷积过程；α_l为低分辨率密度图对应的子分支的参数,α_h为主干网络生成高分辨率密度图的参数；

步骤(5)具体过程如下：

(5-1)通过对最终输出的高分辨率度图中所有像素求和得出总体人群计数：

步骤(6)具体过程如下：

(6-1)将输出的高分辨率度图与人工标注的真实密度图进行损失计算，低分辨率密度图包含输入图像p_i中人群的空间关联信息；低分辨率密度图是高分辨率密度图预测任务的重要特征；通过最小化损失函数L(α_l,α_h)来优化参数α_l和α_h，

其中λ_l和λ_h是标量超参数；B_i和h_i分别表示人工标注的真实的低分辨率密度图和高分辨率密度图；

(6-2)采用Adam优化器进行训练，利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率，经过偏置校正后，每一次迭代学习率都有个确定范围，使得参数比较平稳；

(6-3)结束训练，得到最优的人群计数网络；

步骤(7)具体过程如下：

(7-1)将测试图像集输入训练好的基于多尺度密度图融合空洞卷积的人群计数网络中；

(7-2)输出对应的人群分布密度图以及总人数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学，未经杭州电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010167699.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种货道宽度可调节的自动售货机
下一篇：基于并联空洞卷积和身体结构约束的人体姿态检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多尺度密度图融合空洞卷积的人群计数方法有效

专利文献下载