[发明专利]一种更快的基于深度学习的密集目标计数方法在审

专利信息
申请号: 201811553198.0 申请日: 2018-12-19
公开(公告)号: CN109741301A 公开(公告)日: 2019-05-10
发明(设计)人: 许向阳;余睿 申请(专利权)人: 北京理工大学
主分类号: G06T7/00 分类号: G06T7/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 场景 图像处理领域 安全事故 工作效率 计数领域 计数问题 检测结果 快速检测 目标整合 轻便设备 人流控制 实时监控 网络结构 检测 学习 应用 钢筋 人群 移动 保证 研究
【权利要求书】:

1.一种更块的基于深度学习的密集目标计数方法,其特征是:在基于深度学习的技术上,构建一种新的轻量化神经网络结构,并通过学习生成相似的测试图片的密度图的方式,实现对密集目标的图片进行快速数目统计的目标,其最终的效果在保证较好准确率的同时大大地加快了识别速度,其网络结构的规模远低于其他同类算法。

2.根据权利要求1所述的一种更快的基于深度学习的密集目标技术方法,在数据集制作密度图标签的详细步骤是:对图像上所有目标位置进行人工标记,一般认定为该目标所占像素点区域的重心位置。使某一个目标的标记记作Pi(xi,yi),并将其表示为δ(x-xi),这样对于具有N个目标的的图像I,为了具有物理密度的连续性,进行归一化高斯处理,从而生成相对应的密度图和数值矩阵文件,并作为标签文件。

3.根据权利要求1所述的一种更快的基于深度学习的密集目标技术方法,构建的新的轻量化网络结构具体是:主要分为前后相连的两个部分组成,第一个部分是前期特征提取器,第二个为多尺度特征学习器。对于第一部分由conv-pooling-conv-pooling组成,第一个卷积层为24个大小为5*5的卷积核,第一个池化层是大小为2*2,步长为1的最大值池化层,第二个卷积层为48个大小为3*3的卷积核,第二个池化层同样为大小为2*2,步长为1的最大值池化层。

紧接着第二部分主要由一个多孔空间金字塔池化结构组成,由并行的4个空洞卷积层组成,其区别在于适用不同的采样率参数,分别为2,4,6,8。最后再接一个1×1的卷积生成预测密度图,且所有的卷积函数适用relu函数进行非线性激活。

4.根据权利要求1所述的一种更快的基于深度学习的密集目标技术方法,在训练测试网络的详细步骤是:

(1)创立训练样本

将每一张图片平均分为大小一致、无重叠部分的9份子图片。而对于标签文件,在经过同样操作的处理之后,还需主要保持每一小块密度矩阵的积分值与原图真实数目一致。

(2)训练:首先定义目标函数为带有正则化的均方误差函数如下所示:

然后采用k-折叠交叉验证方法进行训练。将数据集分为k份,一次epoch一共训练k次,每次以k-1份作为训练集,1份作为验证集。最后在网络构建完成之后开始进行对训练图像的自动学习,直到收敛后停止训练,并生成相应的模型文件。

(3)测试:将待测试图片输入到已训练好的网络,并输出相应的密度图,对其数值矩阵进行求和得到最终的测试数目。

(4)评价指标:利用求取平均绝对误差(MAE)和均方误差(MSE)来评估,MAE来评估模型的准确性,MSE来评估模型的鲁棒性,具体计算公式如下所示:

N指图片总数目,zi和分别代表的真实数目和预测数目。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811553198.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top