[发明专利]一种基于尺度等级的图像缩放裁剪方法在审

专利信息
申请号: 202010032589.9 申请日: 2020-01-13
公开(公告)号: CN111242839A 公开(公告)日: 2020-06-05
发明(设计)人: 周靖凯;刘琼 申请(专利权)人: 华南理工大学
主分类号: G06T3/00 分类号: G06T3/00;G06T3/40;G06T7/11
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 何淑珍;江裕强
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 尺度 等级 图像 缩放 裁剪 方法
【说明书】:

发明公开了一种基于尺度等级的图像缩放裁剪方法。所述方法包括以下步骤:获取包括训练图像的训练集,计算训练图像的图像尺度指数,根据图像尺度指数生成大、中、小三种尺度等级的标注;根据尺度等级的标注,训练尺度等级分类器;获取包括测试图像的测试集,使用尺度等级分类器分类测试图像的尺度等级;根据尺度等级缩放、裁剪测试图像。本发明对测试图像进行区别化的缩放和裁剪,显著提高小目标的检测精度,同时避免了引入过多的虚警。此外,由于区别化的缩放和裁剪,本发明只增加的少量检测时的计算开销。

技术领域

本发明涉及一种数据增强方法,更具体地,涉及一种基于尺度等级的图像缩放裁剪方法。

背景技术

尽管深度学习方法在通用目标检测领域获得了巨大的成功,它们在小目标检测上的表现不尽人意。小目标挑战通常包括三个方面:更多的小目标、更低的目标平均分辨率和更小的目标相对尺度。下文对比性分析了COCO、ImageNet和VisDrone 2018数据集,进一步阐述这三个方面。

更多的小目标。我们统计了COCO和VisDrone 2018训练集中的目标像素面积分布,VisDrone 2018中约有60%的目标面积不超过1000像素,约75%的目标面积不超过2000像素。而COCO中这样的目标分别只有约40%和55%。由此可见,小目标挑战数据集VisDrone2018有更多的小目标。

更低的目标的平均分辨率。COCO中目标平均面积为2.05e+4像素。而VisDrone2018中目标平均面积仅为2.49e+3像素,是COCO的1/8。更低的分辨率意味着目标携带的外观信息更少、信噪比更低,更难被检测器检出。

除绝对尺度外,小目标挑战的另一方面是目标相对尺度也较小。在检测阶段,图像会被缩放至预设大小。小的目标相对尺度导致缩放后的目标分辨率低,外观信息少,影响检测精度。我们统计了COCO、ImageNet DET和VisDrone 2018中ORS的累计分布。相比于COCO和ImageNet,VisDrone 2018中绝大多数目标具有更小的相对尺度。其中约97%的目标占图像面积不到1%。VisDrone 2018、COCO和ImageNet中ORS的中位数分别为1.73e-2,9.56e-2和5.14e-1。如果让VisDrone 2018中的目标同COCO或ImageNet中的目标尺度相当,VisDrone2018的图片将被放大至COCO图片的5倍、ImageNet图片的29倍。受限于GPU显存,现有深度学习方法难以直接处理如此庞大的图片。

为了解决上述三个小目标挑战,本发明提出一种基于尺度等级的图像缩放裁剪方法:计算训练图像的图像尺度指数,根据图像尺度指数生成大、中、小三种尺度等级的标注;根据尺度等级的标注,训练尺度等级分类器;使用尺度等级分类器分类测试图像的尺度等级;根据尺度等级缩放、裁剪测试图像。

本发明涉及到以下现有技术:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010032589.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top