[发明专利]一种更快的基于深度学习的密集目标计数方法在审
申请号: | 201811553198.0 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109741301A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 许向阳;余睿 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场景 图像处理领域 安全事故 工作效率 计数领域 计数问题 检测结果 快速检测 目标整合 轻便设备 人流控制 实时监控 网络结构 检测 学习 应用 钢筋 人群 移动 保证 研究 | ||
1.一种更块的基于深度学习的密集目标计数方法,其特征是:在基于深度学习的技术上,构建一种新的轻量化神经网络结构,并通过学习生成相似的测试图片的密度图的方式,实现对密集目标的图片进行快速数目统计的目标,其最终的效果在保证较好准确率的同时大大地加快了识别速度,其网络结构的规模远低于其他同类算法。
2.根据权利要求1所述的一种更快的基于深度学习的密集目标技术方法,在数据集制作密度图标签的详细步骤是:对图像上所有目标位置进行人工标记,一般认定为该目标所占像素点区域的重心位置。使某一个目标的标记记作Pi(xi,yi),并将其表示为δ(x-xi),这样对于具有N个目标的的图像I,为了具有物理密度的连续性,进行归一化高斯处理,从而生成相对应的密度图和数值矩阵文件,并作为标签文件。
3.根据权利要求1所述的一种更快的基于深度学习的密集目标技术方法,构建的新的轻量化网络结构具体是:主要分为前后相连的两个部分组成,第一个部分是前期特征提取器,第二个为多尺度特征学习器。对于第一部分由conv-pooling-conv-pooling组成,第一个卷积层为24个大小为5*5的卷积核,第一个池化层是大小为2*2,步长为1的最大值池化层,第二个卷积层为48个大小为3*3的卷积核,第二个池化层同样为大小为2*2,步长为1的最大值池化层。
紧接着第二部分主要由一个多孔空间金字塔池化结构组成,由并行的4个空洞卷积层组成,其区别在于适用不同的采样率参数,分别为2,4,6,8。最后再接一个1×1的卷积生成预测密度图,且所有的卷积函数适用relu函数进行非线性激活。
4.根据权利要求1所述的一种更快的基于深度学习的密集目标技术方法,在训练测试网络的详细步骤是:
(1)创立训练样本
将每一张图片平均分为大小一致、无重叠部分的9份子图片。而对于标签文件,在经过同样操作的处理之后,还需主要保持每一小块密度矩阵的积分值与原图真实数目一致。
(2)训练:首先定义目标函数为带有正则化的均方误差函数如下所示:
然后采用k-折叠交叉验证方法进行训练。将数据集分为k份,一次epoch一共训练k次,每次以k-1份作为训练集,1份作为验证集。最后在网络构建完成之后开始进行对训练图像的自动学习,直到收敛后停止训练,并生成相应的模型文件。
(3)测试:将待测试图片输入到已训练好的网络,并输出相应的密度图,对其数值矩阵进行求和得到最终的测试数目。
(4)评价指标:利用求取平均绝对误差(MAE)和均方误差(MSE)来评估,MAE来评估模型的准确性,MSE来评估模型的鲁棒性,具体计算公式如下所示:
N指图片总数目,zi和分别代表的真实数目和预测数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811553198.0/1.html,转载请声明来源钻瓜专利网。