[发明专利]多尺度目标检测方法、装置及计算机可读存储介质在审

专利信息
申请号: 202111038815.5 申请日: 2021-09-06
公开(公告)号: CN113869138A 公开(公告)日: 2021-12-31
发明(设计)人: 陈海波;高春洋 申请(专利权)人: 深延科技(北京)有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08
代理公司: 苏州领跃知识产权代理有限公司 32370 代理人: 王宁
地址: 100081 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 尺度 目标 检测 方法 装置 计算机 可读 存储 介质
【说明书】:

本申请提供了一种多尺度目标检测方法、装置、电子设备及计算机可读存储介质,所述方法包括:获取包括自然场景的多个图像并对多个图像进行数据处理,以生成训练样本集合;建立并使用训练样本集合训练多尺度特征提取模型,使得训练完成的多尺度特征提取模型能够识别所述图像中不同空间和不同尺度的多个特征;建立并使用训练样本集合训练detr检测模型,使得训练完成的detr检测模型能够识别图像中的多个特征;对多尺度特征提取模型和detr检测模型进行模型融合以获取融合模型,并且训练所述融合模型;以及使用训练完成的融合模型进行目标检测。解决本地操作无法掌握尺度多变的情况;提供更强大的特征提取能力和更快速的目标检测功能。

技术领域

本申请涉及计算机视觉技术和目标检测技术领域,尤其涉及一种多尺度的识别方法、装置、电子设备及计算机可读存储介质。

背景技术

机器视觉检测技术作为当今工业中的一项重要技术,被广泛应用于基于内容的图像检索、汽车安全、视频监控和机器人技术等各大领域,并且随着技术的发展,机器视觉检测技术被应用于越来越多的领域,以满足不断提升的市场需求。

计算机视觉对于目标运动的分析可以大致分为三个层次:运动分割,目标检测;目标跟踪;动作识别,行为描述。其中,目标检测既是计算机视觉领域要解决的基础任务之一,同时它也是视频监控技术的基本任务。由于视频中的目标具有不同姿态且经常出现遮挡、其运动具有不规则性,同时考虑到监控视频的景深、分辨率、天气、光照等条件和场景的多样性,而且目标检测算法的结果将直接影响后续的跟踪、动作识别和行为描述的效果。故即使在技术发展的今天,目标检测这一基本任务仍然是非常具有挑战性的课题,存在很大的提升潜力和空间。。

发明内容

本申请的目的在于提供更加稳定、准确率更高的目标检测方法、装置、电子设备及计算机可读存储介质,其基于深度学习的方法,应用广泛。

本申请的目的采用以下技术方案实现:

第一方面,本申请提供了一种多尺度目标检测方法,所述方法包括:获取包括自然场景的多个图像并对所述多个图像进行数据处理,以生成训练样本集合;建立并使用所述训练样本集合训练多尺度特征提取模型,使得训练完成的所述多尺度特征提取模型能够识别所述图像中不同空间和不同尺度的多个特征;建立并使用所述训练样本集合训练detr检测模型,使得训练完成的所述detr检测模型能够识别所述图像中的多个特征;对所述多尺度特征提取模型和所述detr检测模型进行模型融合以获取融合模型,并且训练所述融合模型;以及使用训练完成的所述融合模型进行目标检测。

该技术方案的有益效果在于,在特征金字塔网络中加入了多尺度识别模块来解决本地操作无法掌握尺度多变的情况,为多有的特征层带去更丰富的信息。而且,通过进行特征强融合,在一阶段的情况下,提供更强大的特征提取能力和更快速的目标检测功能。

在一些可选的实施例中,所述多尺度目标检测方法,包括:所述数据处理包括:使得获得的所述多个图像的大小符合所述特征提取模型和所述注意力机制模型的输入需求;对所述多个图像进行对比度增强处理;以及以对所述多个图像进行多样性扩展的方式扩展所述多个图像的数量。该技术方案的有益效果在于,通过对图像进行各种处理,能够丰富数据集的信息,从而更全面地对构建的模型进行训练,使得训练后的模型能够更准确地进行目标识别。

在一些可选的实施例中,在所述方法种,所述多个图像进行对比度增强处理具体包括:以RGB图像的格式使用所述多个图像以对所述多尺度特征提取模型和所述detr检测模型进行训练,并且根据训练结果对所述多个图像进行RGB归一化。该技术方案的有益效果在于,使得训练后的模型能够不受图像中光照变化和阴影的影响,提高对目标的检测准确度。

在一些可选的实施例中,在所述方法中,对所述多个图像进行多样性扩展具体包括:对所述图像进行镜像翻转;对所述图像进行随机剪裁;以及所述多个图像彼此之间的拼贴。该技术方案的有益效果在于,对图像数据进行了数据增强,使得能够丰富训练样本,从而更好地训练模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深延科技(北京)有限公司,未经深延科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111038815.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top