[发明专利]一种更快的基于深度学习的密集目标计数方法在审

申请号：	201811553198.0	申请日：	2018-12-19
公开（公告）号：	CN109741301A	公开（公告）日：	2019-05-10
发明（设计）人：	许向阳;余睿	申请（专利权）人：	北京理工大学
主分类号：	G06T7/00	分类号：	G06T7/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	100081 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	场景图像处理领域安全事故工作效率计数领域计数问题检测结果快速检测目标整合轻便设备人流控制实时监控网络结构检测学习应用钢筋人群移动保证研究
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种更块的基于深度学习的密集目标计数方法，其特征是：在基于深度学习的技术上，构建一种新的轻量化神经网络结构，并通过学习生成相似的测试图片的密度图的方式，实现对密集目标的图片进行快速数目统计的目标，其最终的效果在保证较好准确率的同时大大地加快了识别速度，其网络结构的规模远低于其他同类算法。

2.根据权利要求1所述的一种更快的基于深度学习的密集目标技术方法，在数据集制作密度图标签的详细步骤是：对图像上所有目标位置进行人工标记，一般认定为该目标所占像素点区域的重心位置。使某一个目标的标记记作Pi(xi,yi)，并将其表示为δ(x-x_i)，这样对于具有N个目标的的图像I，为了具有物理密度的连续性，进行归一化高斯处理，从而生成相对应的密度图和数值矩阵文件，并作为标签文件。

3.根据权利要求1所述的一种更快的基于深度学习的密集目标技术方法，构建的新的轻量化网络结构具体是：主要分为前后相连的两个部分组成，第一个部分是前期特征提取器，第二个为多尺度特征学习器。对于第一部分由conv-pooling-conv-pooling组成，第一个卷积层为24个大小为5*5的卷积核，第一个池化层是大小为2*2，步长为1的最大值池化层，第二个卷积层为48个大小为3*3的卷积核，第二个池化层同样为大小为2*2，步长为1的最大值池化层。

紧接着第二部分主要由一个多孔空间金字塔池化结构组成，由并行的4个空洞卷积层组成，其区别在于适用不同的采样率参数，分别为2，4，6，8。最后再接一个1×1的卷积生成预测密度图，且所有的卷积函数适用relu函数进行非线性激活。

4.根据权利要求1所述的一种更快的基于深度学习的密集目标技术方法，在训练测试网络的详细步骤是：

(1)创立训练样本

将每一张图片平均分为大小一致、无重叠部分的9份子图片。而对于标签文件，在经过同样操作的处理之后，还需主要保持每一小块密度矩阵的积分值与原图真实数目一致。

(2)训练：首先定义目标函数为带有正则化的均方误差函数如下所示：

然后采用k-折叠交叉验证方法进行训练。将数据集分为k份，一次epoch一共训练k次，每次以k-1份作为训练集，1份作为验证集。最后在网络构建完成之后开始进行对训练图像的自动学习，直到收敛后停止训练，并生成相应的模型文件。

(3)测试：将待测试图片输入到已训练好的网络，并输出相应的密度图，对其数值矩阵进行求和得到最终的测试数目。

(4)评价指标：利用求取平均绝对误差(MAE)和均方误差(MSE)来评估，MAE来评估模型的准确性，MSE来评估模型的鲁棒性，具体计算公式如下所示：

N指图片总数目，z_i和分别代表的真实数目和预测数目。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京理工大学，未经北京理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】