[发明专利]面向无人机目标检测的动态上下文关系采集网络结构在审
申请号: | 202211509371.3 | 申请日: | 2022-11-29 |
公开(公告)号: | CN115830477A | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 郗岳;苗启广;冯军美;刘德阳;李飞;牛冠冲 | 申请(专利权)人: | 西安电子科技大学广州研究院;西安电子科技大学 |
主分类号: | G06V20/17 | 分类号: | G06V20/17;G06V10/764;G06V10/766;G06V10/82;G06N3/0442;G06N3/0464;G06N3/0895 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 弓长 |
地址: | 510700 广东省广州市黄*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 无人机 目标 检测 动态 上下文 关系 采集 网络 结构 | ||
本发明公开了一种面向无人机目标检测的动态上下文关系采集网络(DyCC‑Net)结构,包括骨干网络,骨干网络通过动态上下文关系采集器(DyCC)连接顶到底通路,顶到底通路连接检测头。本发明DyCC‑Net通过DyCC,实现了对于输入图像的感知推理。DyCC‑Net能够自动地区分不同难度的图像,自主地选择是否执行上下文关系采集模块,从而在保障目标检测性能的前提下,减少算法计算开销的目标。实施例表明,DyCC‑Net的检测性能不仅比国际最先进的检测算法还要高出2%左右的准确率,而且算法的计算开销减少约10%。
技术领域
本发明属于智能无人系统、人工智能以及计算机视觉技术领域,涉及一种面向无人机目标检测的动态上下文关系采集网络结构。
背景技术
挂载可见光相机的无人机平台已经受到广泛的关注。该平台能够快速、低成本地部署在各种新型应用中,例如,航空摄影和航空视频监控。自动识别无人机图像或者视频数据的感兴趣目标,具有强烈的应用需求。得益于深度神经网络在遥感图像处理领域的发展,以无人机为视角的目标检测(无人机目标检测)算法已经取得了一定的进展。
主流的无人机目标检测算法,通常会设计一个上下文关系采集模块,通过采集目标周围的上下文关系,从而丰富低质量的目标所在区域的信息。该类方法虽然可以有效地提升已有检测算法的准确率,但将其部署在无人机平台并实现机载处理,依然存在诸多问题。其中,最为棘手的问题是,算法本身巨额的计算开销与无人机平台极其有限的计算能力之间的矛盾。
绝大多数无人机目标检测算法均采用静态架构。如图1所示,面对不同识别难度的输入图像,均采用上下文关系采集模块处理。显然,对简单的图像,依然执行该采集模块,会造成计算资源的巨大浪费。
发明内容
本发明的目的是提供一种面向无人机目标检测的动态上下文关系采集网络结构,该结构能够自动地区分不同难度的图像,自主地选择是否执行上下文采关系采集模块,从而达到减少检测算法开销的目标。
本发明所采用的技术方案是,面向无人机目标检测的动态上下文关系采集网络结构,包括骨干网络,骨干网络通过动态上下文采集器连接顶到底通路,顶到底通路连接检测头。
本发明的特点还在于:
动态上下文采集器包括动态门,动态门用于学习从输入图像特征图Ci至门信号的映射函数,动态门包括门网络和激活函数。
门网络的结构包括依次连接的一个全局平均池化层GAP、全连接层FC1、全连接层FC2以及一个ReLU层δ组成;
门网络的输出采用如下公式(1)表示:
其中,Ci是FPN第i层的输入,假设GateNet的输入特征的形状为Hi×Wi×Ci,Hi表示输入特征的长度、Wi表示输入特征的宽度、Ci表示输入特征的通道,输出特征形状为Ho×Wo×Co,H0表示输出特征的长度、W0表示输出特征的宽度、C0表示输出特征的通道。
门网络的结构采用3×3卷积层Conv采集上下文关系信息,卷积层之后是全局平均池化层GAP,用于捕获整个图像的上下文关系信息,最后,使用全连接层FC输出一个二维矢量采用如下公式(2)表示门网络的输出
门网络包含2×2的最大池化层Max Pooling、步长为2的3×3卷积层Conv,然后是全局平均池化GAP和一个全连接层FC,采用如下公式(3)计算的输出
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学广州研究院;西安电子科技大学,未经西安电子科技大学广州研究院;西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211509371.3/2.html,转载请声明来源钻瓜专利网。