[发明专利]一种改进的Centernet复杂环境目标检测方法有效
申请号: | 202110408765.9 | 申请日: | 2021-04-16 |
公开(公告)号: | CN112990102B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 邵继业;罗钟福;彭倍;葛森 | 申请(专利权)人: | 四川阿泰因机器人智能装备有限公司 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/774;G06V10/82;G06N3/08 |
代理公司: | 成都虹盛汇泉专利代理有限公司 51268 | 代理人: | 周永宏 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 centernet 复杂 环境 目标 检测 方法 | ||
本发明公开一种改进的Centernet的复杂环境目标检测方法,应用于计算机视觉领域,针对现有技术在拥挤、模糊、光线不足等特殊场景下的检测性能低下的问题。本发明基于CenterNet模型,重新定义了热度图的生成规则以适应目标宽高比的变化;同时,把原始对宽高做预测的分支网络调整为使用基于分布概率模型的多输出预测,再通过积分得到宽高信息,缓解拥挤场景下的预测框模糊边界问题;并基于多核最大值滤波的极大值抑制代替方案处理热度图,实现在保留最佳检测框的同时,在一定程度降低误检框置信度,从而提升整体精度。
技术领域
本发明属于计算机视觉领域,特别涉及一种复杂场景目标检测技术。
背景技术
目标检测是计算机视觉领域的一项重要研究分支。目标检测要解决的问题简单来说可以定义“什么目标在哪里”,目前从网络模型的算法结构上可以分为“二阶段”和“一阶段”的目标检测算法,差别在于前者分两步检测目标位置:首先基于区域建议网络(RPN,Region Proposal Network)生成可能的目标框,再对目标框做分类,即把检测问题转化为分类问题;而后者则直接从图像的卷积层特征回归出目标框,即把检测问题转化为回归问题。此前二阶段网络较后者往往能取得更高的精度,但一阶段网络直接输入到输出的“端到端”的训练、推理方式,速度快,有利于部署,随着人们的研究深入,一阶段网络的精度大大提高,已经不亚于二阶段方法。
与此同时,一阶段网络中根据是否使用锚框(anchor)机制又可以简单划分为Anchor based方法和Anchor free方法,基于anchor的方法通过对卷积特征点上放置多个锚框,产生大量目标框,往往能得到更好的目标召回率,从而实现精度的提升,然而带来的一个问题是对同一目标将出现许多重复框,这必然要求非极大值抑制算法的应用来去重,这无疑加大了算法复杂度,影响了算法效率。而CenterNet为Xingyi Zhou人在2019提出的论文《Object as Points》中提出的anchor free模型,具有结构简单,拓展容易,检测指标较高等特点。
目前目标检测领域从2001年Paul Viola等人提出人脸检测算法来已有将近20年发展,各类目标检测算法在安防、生产等取得巨大应用,但由于受到光线、场景等客观条件的影响,复杂场景下的目标检测算法往往难以稳定运行,例如此前苏格兰一场足球赛上AI裁判把裁判的光头误检测为足球,导致相机焦点没有及时跟随足球移动,给转播带来了麻烦。而此类问题若出现在自动驾驶、门禁安防中则可能会导致严重后果,因此有必要对复杂场景下的目标检测算法做进一步的研究。同济大学和北京大学的学者在2018年合作论文《Repulsion Loss:Detecting Pedestrians in a Crowd》中从损失函数的角度针对行人检测提出了适用于二阶段网络的repulsion loss,改善RPN生成的预测框质量;而KevinZhang人2019的论文《Double Anchor R-CNN for Human Detection in a Crowd》中则基于二阶段网路同时预测头部和身体,使用组合式的方式来检测行人,提高拥挤场景的行人检测精度,降低漏检率。
发明内容
为解决上述技术问题,本发明提出一种改进的Centernet复杂环境目标检测方法,使用基于概率的形式预测目标框的宽和高的概率分布,通过积分确定宽高,而非直接预测宽高信息,能给出更稳定的宽高预测,此外新定义的热度图规则反映了目标的形状,以及所提出的多核最大值滤波的后处理方法一定程度缓解原模型大目标重复检测的问题。
本发明采用的技术方案为:一种改进的Centernet的复杂环境目标检测方法,包括:
S1、改进现有的CenterNet网络结构,改进后的CenterNet网络结构包括:用于特征提取的骨干网络、用于特征聚合的特征聚合网络以及分支预测输出头网络;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川阿泰因机器人智能装备有限公司,未经四川阿泰因机器人智能装备有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110408765.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种湿转子塑封密封结构
- 下一篇:一种熔池喷射锌精矿的一步炼锌方法