[发明专利]一种基于位置分布的大规模场景目标感知方法在审
申请号: | 202211118645.6 | 申请日: | 2022-09-14 |
公开(公告)号: | CN115661620A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 刘庆杰;刘晨光;高广帅;王蕴红 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06N3/0464;G06N3/08;G06V10/40;G06V10/82 |
代理公司: | 北京天汇航智知识产权代理事务所(普通合伙) 11987 | 代理人: | 高永 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 位置 分布 大规模 场景 目标 感知 方法 | ||
一种基于位置分布的大规模场景目标感知方法,包括步骤:将给定的大规模场景输入到主干网络中进行特征提取;将经过主干网络中进行特征提取后的场景数据输入至多重卷积层进行处理;基于多重卷积层进行处理后的数据,计算输出预测的定位图,目标偏移和目标边界框的宽和高;基于定位图,设置局部放缩模块LSM自适应的搜索定位图图像中的聚集区域,并对其进行适量的放缩以适合检测器的容量;修改原始数据的一部分损失函数,使得能够更容易的进行训练,该方法可以实现对密集小目标的检测,并且能够缓解目标分布不均匀的问题。
技术领域
本发明涉及图像处理领域,用于目标感知,具体涉及一种基于位置分布的大规模场景目标感知方法。
背景技术
目标感知,作为计算机视觉领域的基本任务,具有广泛的应用场景,如灾害预报、交通流量控制等。目标感知为一个多任务的的学习框架,旨在同时估计目标的类别和对目标进行精准的定位。
随着深度学习的快速发展,依赖于深度学习强大的特征表征能力,尤其是卷积神经网络(CNNs)的发展,目标感知的性能有了显著的增长。现存比较优秀的目标感知器,具有代表性的几个范式如二阶段的Faster-RCNN,单阶段的YOLO和SSD,以及无锚框的FCOS和CenterNet,其在自然场景中的数据集上表现出优异的性能。自然场景中的图像通常分辨率比较低,例如MS COCO中的分辨率为600×400。然而,当把这些方法应用在航拍领域,却表现效果不佳。
这些方法在自然图像中表现出很好的性能,然而在大规模场景中的性能并不能达到最优,这些图像一般由无人机、飞机、卫星、高清智能相机等拍摄获得。对这些图像中的目标感知具有实际意义,比如无人驾驶、遥感图像目标感知、城市智慧交通和智慧城市构建等场景。
大规模场景中的目标感知更具有挑战性,其表现不佳的原因主要体现在以下两个方面:1)大规模场景数据集中包含大量的小目标,在这些数据集中小目标占比很大,小目标的尺寸远小于整个图像的分辨率,这使得检测器在有限的分辨率下难以识别出场景中的小目标;例如Visdrone中的分辨率为2000×1500。由于有限的分辨率和粗糙的细节信息的缺失,使得检测器很难识别小目标;2)大规模场景中的目标呈现稀疏聚集的分布特点,其目标分布不均匀,例如,在十字路口或停车场的车辆容易聚集,而在其他地方比较稀疏。严重失衡的数据分布也导致检测器的性能低下。
为解决以上问题,目前流行的方案主要是基于图像裁剪的策略。这类方法一般是将大尺度的图像分成分辨率比较小的图像块,对每个图像块执行目标感知,最后再将图像块的检测结果合并到大图中。最简单直接的方案就是将图像均匀分块或者随机裁剪。这种简单的策略在一定程度上可以提升小目标的检测精度,因为对图像裁剪后在放大可以提升小目标的尺度。但是这种方法会使得图像块中包含大量的背景,从而造成正负样本的严重失衡,使得效率极为低下。另外,对于尺寸比较大的目标,可能会从中间分开。为了提升效率和最大程度的提升目标信息的利用率,ClusDet设计了一个聚集区域生成网络(clusterproposal sub-network,CPNet)和一个尺度估计的子网络(Scale estimation sub-network,ScaleNet),然后将聚集区域的检测和全局的检测进行融合。DMNet利用密度图可以很直观的反映目标分布的思想,然后根据设定的密度阈值裁剪出图像的聚集区域。UFPMP-Det通过一个简单的聚类方法(K-means聚类)得到目标的聚集区域,然后以一种马赛克(Mosaic)的将这些区域组装到一幅图像中,从而大大提升目标信息的利用率。这类方法表现出很好的检测性能,因为这样能够最大程度的保留密集小目标所在的区域,抑制掉无用的背景信息,从而加快了推断速度。然而,设计专门的网络来寻找目标的聚集区域,然后离线状态下裁剪并存储,最后再进行目标感知。因此,他们的检测性能严重依赖于聚类区域生成的网络设计。另外,离线裁剪然后存储再单独送入检测器的方法也大大减缓了检测效率。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于位置分布的大规模场景目标感知方法,可以实现对密集小目标的检测,并且能够缓解目标分布不均匀的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211118645.6/2.html,转载请声明来源钻瓜专利网。