[发明专利]一种基于尺度等级的图像缩放裁剪方法在审
申请号: | 202010032589.9 | 申请日: | 2020-01-13 |
公开(公告)号: | CN111242839A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 周靖凯;刘琼 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06T3/40;G06T7/11 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 等级 图像 缩放 裁剪 方法 | ||
1.一种基于尺度等级的图像缩放裁剪方法,其特征在于,包括以下步骤:
步骤一、获取包括训练图像的训练集,计算训练图像的图像尺度指数,根据图像尺度指数生成大、中、小三种尺度等级的标注;所述图像尺度指数计算方法如下:
①依据现实世界中物体的长、宽、高划分训练集各个目标类别形成超类,所述超类指多个类别组成的超级类别;
②选定某一超类作为基准,计算超类间目标尺度转换系数;
③依据公式计算图像尺度指数,具体如下:
其中,a(c)为超类c的尺度转换系数,ORS(c)为超类c的目标相对尺度,nc表示当前图像中属于超类c的目标的个数,nimage表示当前图像中目标的个数,Rsuper表示所有超类的集合;所述超类间目标尺度转换系数的计算公式如下:
其中Isub-train代表训练集的子集,该子集中每一张训练图像i均同时包含超类c和基准超类,|*|表示计算子集的训练图像数,对于子集中的训练图像i,ORS(c)表示超类c的目标相对尺度,ORS(baseline)表示基准超类的目标相对尺度;所述目标相对尺度的计算公式如下:
其中,Areao代表属于超类c的目标o的面积,Areaimage表示训练图像的面积,nc表示当前训练图像中属于超类c的目标的个数;
步骤二、根据尺度等级的标注,训练尺度等级分类器;
步骤三、获取包括测试图像的测试集,使用尺度等级分类器分类测试图像的尺度等级;
步骤四,根据尺度等级缩放、裁剪测试图像。
2.根据权利要求1所述的一种基于尺度等级的图像缩放裁剪方法,其特征在于,步骤一中,所述生成大、中、小三种尺度等级的标注,是统计训练集的图像尺度指数分布,人为设定两个图像尺度指数阈值,划分大、中、小三种尺度等级。
3.根据权利要求1所述的一种基于尺度等级的图像缩放裁剪方法,其特征在于,步骤二中,所述尺度等级分类器由主干网络、感知野自适应模块和全连接分类模块串联组成,先将图像输入主干网络提取主干特征,再将主干特征输入感知野自适应模块进行特征调整,最后将调整好的特征输入全连接分类模块分类图像尺度等级;
所述主干网络为50层的残差网络,该残差网络包括五阶,每一阶均由若干个残差模块串联而成且每一阶的特征尺寸相同,相邻各阶之间存在2倍下采样层,下采样后特征尺寸缩小两倍;最终提取的主干特征为主干网络二阶至五阶每阶最后一张特征图的集合;
所述感知野自适应模块先使用特征归一化层对特征进行通道归一化,再使用特征拼接操作,拼接特征形成超特征,最后使用通道注意力分支,调整超特征的通道注意力;所述特征归一化层是步长为1、补零填充为0的1*1卷积层,用于使主干特征的通道数归一化至256;所述特征拼接操作将主干特征在通道维度上拼接;所述通道注意力分支由全局池化层、1024*512的全连接层和512*1024的全连接层串联组成;
所述全连接分类模块由全局池化层、1024*512的全连接层和512*3的全连接层串联组成。
4.根据权利要求3所述的一种基于尺度等级的图像缩放裁剪方法,其特征在于,训练尺度等级分类器使用交叉熵函数作为损失函数,使用随机梯度下降作为网络优化方法。
5.根据权利要求1所述的一种基于尺度等级的图像缩放裁剪方法,其特征在于,步骤三中,所述使用尺度等级分类器分类测试图像的尺度等级,是指将测试图像输入尺度等级分类器获取输入测试图像的尺度等级。
6.根据权利要求1所述的一种基于尺度等级的图像缩放裁剪方法,其特征在于,步骤四中,所述根据尺度等级缩放、裁剪图像,其中缩放图像步骤为对尺度等级为中、大等级的测试图像使用双线性插值进行缩放,对尺度等级为小等级的测试图像使用深度超分辨率算法进行缩放;所述深度超分辨率算法指将低分辨率图映射至高分辨率图的深度学习方法。
7.根据权利要求1所述的一种基于尺度等级的图像缩放裁剪方法,其特征在于,步骤四中,所述根据尺度等级缩放、裁剪图像,其中裁剪图像步骤为对尺度等级为大等级的图像不进行裁剪,对尺度等级为中等级的图像进行四分裁剪,对尺度等级为小等级的图像进行九分裁剪;所述四分裁剪指四等分裁剪图像,所述九分裁剪指九等分裁剪图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010032589.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种生箔机铜箔水洗装置
- 下一篇:一种新型游艇便于收放的船锚
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序