[发明专利]基于压缩感知和卷积网络的物体检测方法有效
申请号: | 202010113024.3 | 申请日: | 2020-02-24 |
公开(公告)号: | CN111428751B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 索津莉;张志宏;任杰;戴琼海 | 申请(专利权)人: | 清华大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王艳斌 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 压缩 感知 卷积 网络 物体 检测 方法 | ||
本发明公开了一种基于压缩感知和卷积网络的物体检测方法,该方法构建了二维网络隐层引导网络的收敛方向,并采用重建原始信号作为引导信号,在网络结构设计上,采用了级联式网络设计:第一部分是多通道整图重构网络,将一维压缩编码信号重构至和原始信号接近的二维图像,转换为便于提取检测特征的形式。第二部分是检测网络,从第一网络的输出结果辨识场景中存在的物体和类别。在网络学习方面,依次训练两个子网络,然后进行联合网络的训练,解决了联合训练中的级联后梯度变化和预训练不一致的问题,获得优于子网络独立训练更好的性能。该方法实现了从压缩感知信号到物体检测结果的端到端映射,以更低的采样率和采集成本来完成检测任务。
技术领域
本发明涉及视觉任务技术领域,特别涉及一种基于压缩感知和卷积网络的物体检测方法及装置。
背景技术
当前视觉任务所处理和利用的图片等数据主要来自于面阵探测器,通过面阵探测器可以一次性记录所需要的图片场景,也可以获取一定帧率下的视频数据等,而奈奎斯特采样定律给出了最低采样频率的限制,这对获得更清晰、更高帧率的视觉数据在硬件设备上提出了更严格的要求。但当借助图片、视频等数据通过进一步处理来获取有价值的信息时,更高分辨率、更高帧率的数据未必会带来更大的方便。一方面,获取更丰富的细节需要提高面阵探测额器的精度和采样率,造成高采样率下的数据量过大而无法在有限带宽下满足传输要求等情况;另一方面,在进一步处理数据的时候会舍弃很多精确采集的细节信息,这部分对指定视觉任务并没有价值的信息在采集时占用了大量资源却在没有被有效利用之后被抛弃,造成了带宽、采集设备等资源的浪费。
因此,改变这一传统的信息采集方式,并且通过采集更少、更有效的信息来完成所需的视觉任务十分关键。压缩感知理论是解决上述问题的一种有效方法,压缩感知理论突破了奈奎斯特采样定率所提出的最低采样频率要求,采用“边采样边压缩”的方式,节省了大量的采集和存储资源,显著降低了采样率,减少了设备成本,通过更少的数据量来获取最有用的信息。在可见光领域,这种压缩采集的做法可以减少数据量、节省传输带宽;在不可见光领域,压缩感知理论可以帮助完成需要使用非常昂贵的特殊频段的面阵探测器才能完成的任务,但传统的压缩感知信号处理算法往往由于需要迭代时间复杂度比较高。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的目的在于提出一种基于压缩感知和卷积网络的物体检测方法,该方法可以以更低的采样率和采集成本完成检测任务。
为达到上述目的,本发明实施例提出了基于压缩感知和卷积网络的物体检测方法,包括以下步骤:采用级联式网络法设计多通道整图重构网络和物体检测网络;利用所述多通道整图重构网络将压缩感知测量信号通过编码解码方式转换为中间重构特征图;将所述中间重构特征图作为所述物体检测网络的输入信号,初始检测出所述中间重构特征图中存在的初始物体位置和初始物体类别;对所述多通道整图重构网络和所述物体检测网络进行联合训练,调整所述中间重构特征图,检测出所述中间重构特征图中存在的最终物体位置和最终物体类别。
本发明实施例的基于压缩感知和卷积网络的物体检测方法,构建了二维网络隐层引导网络的收敛方向,以深度学习方法进行压缩感知视觉信号重构的多通道整图重建网络,以重构信号为输入的物体检测网络部分,并联合网络与对应的联合训练方法以更低的采样率和采集成本来完成检测任务,实现从压缩感知信号到物体检测结果的端到端映射。
另外,根据本发明上述实施例的基于压缩感知和卷积网络的物体检测方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述多通道整图重构网络包括一维卷积编码模块、中间特征转换模块、二维反转卷积模块和输出模块。
进一步地,在本发明的一个实施例中,在所述多通道整图重构网络中具体转换过程为:
通过所述一维卷积编码模块将所述压缩感知测量信号中的一维特征信号分散到多个通道;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010113024.3/2.html,转载请声明来源钻瓜专利网。