[发明专利]一种基于协同回归的人体检测方法有效
申请号: | 202011264121.9 | 申请日: | 2020-11-12 |
公开(公告)号: | CN112070075B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 张逸;何鹏飞;王军;徐晓刚;张文广;朱岳江 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 贾玉霞 |
地址: | 310023 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 协同 回归 人体 检测 方法 | ||
本发明公开一种基于协同回归的人体检测方法,该方法首先预训练深度卷积神经网络骨干模型;然后在模型的输出特征层分别预测人头中心点、人体中心点及对应人体宽高;同时在模型的输出特征层分别回归指向人体中心点的向量和指向人头中心点的向量;训练最小化损失函数,得到人体检测模型;最后将测试集图片输入训练好的模型,利用人头中心点、人体中心点预测值及两者互相指向的向量确定人体位置,结合人体宽高预测值得到人体检测结果。本发明通过充分考虑人群密集场景人体检出率低的问题,利用人群密集场景中人头相较于人体不易产生互相遮挡的特点,提出基于人头中心点、人体中心点协同回归的人体检测方法,在人群密集场景中的人体检出率高。
技术领域
本发明属于人工智能及计算机视觉技术领域,尤其涉及一种基于协同回归的人体检测方法。
背景技术
随着智能化的发展,生产生活的安全已成为了人们日益关注的焦点和需求。工业生产的现场以及城市的许多角落都已经安装了摄像头,为利用计算机视觉技术自动化监控创造了良好的客观条件。
在安防场景中,人体检测方法作为智能视频监控的基础方法,已经被广泛而大量地应用,基于人体检测,可以达成实时的人流量统计、人体姿态识别、人体行为识别等各类细粒度分析。因此,人体检测方法在智能视频监控领域具有非常重要的地位,其检测准确率和召回率直接影响到整体后续智能应用算法的效果。
近年来,随着深度学习技术的发展,目标检测技术的性能也得到了大幅度的提升,以Yolo为代表的目标检测技术在工业界得到了广泛的应用,其中,人体检测技术的应用日益成熟。然而,密集人群场景的检测一直是人体检测技术的难点之一,由于城市场景中摄像头多架设于地铁口、广场、道路等人群密集场景,所拍摄图像中,行人聚集密集,且身体之间多存在一定程度的互相遮挡,主流的目标检测方法直接应用在人群密集场景的人体检测中容易将靠近或存在互相遮挡的多个人检测为一个人,从而导致检测召回率低的问题,亟待提出一种图像信息利用更充分的具有高召回率、高准确率的人体检测技术。
发明内容
针对现有技术的不足,本发明提供一种基于协同回归的人体检测方法,利用人群密集场景中人头相较于人体不易产生互相遮挡的特点,解决现有对视频图像中人群密集场景进行人体检测往往不能获得理想的召回率的问题。
本发明的目的通过如下的技术方案来实现:
一种基于协同回归的人体检测方法,该方法包括如下步骤:
S1:首先预训练深度卷积神经网络骨干模型;
S2:在所述的深度卷积神经网络骨干模型的输出特征层分别预测人头中心点、人体中心点;
S3:在所述的深度卷积神经网络骨干模型的输出特征层分别回归人头中心点指向对应人体中心点的向量和人体中心点指向对应人头中心点的向量;
S4:在所述的深度卷积神经网络骨干模型的输出特征层预测人体宽高;
S5:训练最小化损失函数,得到训练好的人体检测模型;
S6:将测试集图片输入训练好的人体检测模型,利用人头中心点、人体中心点预测值及互相指向的向量确定人体位置,结合人体宽高预测值得到人体检测结果。
进一步地,所述的深度卷积神经网络骨干模型采用
进一步地,所述的S2具体操作如下:
S2.1:所述的深度卷积神经网络骨干模型的输出特征层相对输入图片尺寸的下采样倍数为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011264121.9/2.html,转载请声明来源钻瓜专利网。