[发明专利]密集行人检测方法在审
申请号: | 202111512063.1 | 申请日: | 2021-12-07 |
公开(公告)号: | CN114202774A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 高尚;王一帆;卢湖川 | 申请(专利权)人: | 大连理工大学宁波研究院;大连维视科技有限公司 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V20/52;G06N3/04;G06K9/62;G06V10/774;G06V10/74 |
代理公司: | 辽宁鸿文知识产权代理有限公司 21102 | 代理人: | 苗青 |
地址: | 315016 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 密集 行人 检测 方法 | ||
1.一种密集行人检测方法,其特征在于,步骤如下:
步骤1:基于大型密集行人检测数据集CrowdHuman,读取包围框真值,构建检测头部训练使用的标签;
搭建卷积神经网络,基于单阶段目标检测算法CenterNet,该方法的检测头部有三个输出分支,分别为预测目标的中心点响应即为预测框得分、目标精确位置相对于输出网格位置的偏移量以及目标的宽和高;
步骤2:固定密度估计头部参数,训练其余部分直到收敛;
步骤3:由检测头部的输出计算预测框和对应的得分按照公式(1)计算第i个真值与第π(i)个预测候选框的匹配能量Qi,π(i);其中Ωi表示所有预测候选框的集合,表示预测框置信度,IoU(·,·)表示两个包围框的重叠度,α∈[0,1]为匹配能量函数中预测框质量所占比重;使用匈牙利算法求解公式(2),得到真值框与预测框的最优匹配
步骤4:利用上一步得到的与真值框唯一匹配的预测框和其对应得分,以预测框为中心,以1/6预测框的宽和高为标准差,构建二维高斯激活图,在预测框对应位置叠加得到密度图的训练真值;
步骤5:固定编码器解码器部分和检测头部,使用二范数损失函数单独训练密度估计头部参数,直到收敛;
步骤6:放开所有参数,联合训练整个卷积神经网络,直到收敛;
步骤7:测试应用阶段,将图片输入卷积神经网络,得到四项输出,分别为得分激活图,预测框的高和宽,实际中心点相对于预测输出网格的细微偏移量以及密度预测图Hm;
步骤8:通过步骤7的前三项计算得到预测候选框,每张图筛选得分大于0.05的2000个得分最高的候选框,得到预测候选框集合以及对应的得分设置非极大值抑制的阈值为Nt;
步骤9:初始化输出预测候选框为空集;
步骤10:从中选出最大的一个,得到序号k;更新Hm=Hm-Gauss(bk),其中,Gauss(bk)为候选框bk生成的高斯激活图;更新
步骤11:对所有如果iou(bk,bi)>Nt,计算如果则更新其中Norm()为矩阵的二范数;
步骤12:循环步骤10和步骤11直到为空集;输出和
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学宁波研究院;大连维视科技有限公司,未经大连理工大学宁波研究院;大连维视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111512063.1/1.html,转载请声明来源钻瓜专利网。