[发明专利]一种图片自动裁剪方法有效
申请号: | 201811255476.4 | 申请日: | 2018-10-26 |
公开(公告)号: | CN109448001B | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 郭志强;闫晓葳;赵振;展丽萍;王猛 | 申请(专利权)人: | 世纪开元智印互联科技集团股份有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/136 |
代理公司: | 济南领升专利代理事务所(普通合伙) 37246 | 代理人: | 王吉勇 |
地址: | 250101 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 自动 裁剪 方法 | ||
1.一种图片自动裁剪方法,其特征在于,具体步骤为:
利用待处理图片的高度和宽度信息计算图片比例;
设置待处理图片的输出尺寸,根据所述的输出尺寸确定待处理图片的输出比例;
通过所述的图片比例和所述的输出比例确定计算裁切框的大小;
判断所述待处理图片的图片比例与要求输出比例是否合适,若不合适,则对待处理图片执行缩小或放大操作,若合适,则不执行该操作;
利用已训练好的图片分类模型预测待处理图片的所属类别;
根据待处理图片的所属类别,利用已训练好的显著性预测模型检测待处理图片的显著区域,提取待处理图片的显著特征图;
根据所述待处理图片的显著特征图区分出较重要区域和次重要区域,得到较重要区域的最小外接矩形;
判断所述最小外接矩形是否被裁切框覆盖,根据判断结果执行裁剪或留白处理;若执行裁剪处理,使用裁剪框扫描图片显著特征图,进一步精确调整所述裁剪框在待裁剪图片中的位置;
输出裁剪结果;
所述根据所述待处理图片的显著特征图区分出较重要区域和次重要区域的具体方法:
设定图像二值化阈值,大于设定的阈值的区域为较重要区域,反之为次重要区域;
所述判断所述最小外接矩形是否被裁切框覆盖,执行裁剪或留白处理的原则为:
若最小外接矩形不被裁切框覆盖,则待处理的图片不进行裁切,并通过比较图片比例和冲洗比例判断在待处理图片的左右边或上下边填充白色区域得到输出的尺寸,即留白操作;若最小外接矩形被裁切框覆盖,则执行裁切操作;
构建图片分类模型的具体方法为:
S1.选取图片数据,人工筛选分类,构建数据集,人工确定类别数及每个类别包含的图片种类;
S2.以VGG16模型作为基础网络模型分类框架,构建图片分类模型;VGG16网络是该领域熟知的经典分类网络;
S3.利用构建的数据集,对构建的图片分类模型进行训练,使用softmax函数计算每个类别的概率,其中,softmax函数可表示为:
其中,zi表示图片分类模型最后一层第i个神经元的输出,K为预测类别数目,p(i)表示将待处理图片预测为第i个类别的概率;zk表示图片分类模型最后一层第k个神经元的输出;
S4.待图片分类模型的softmax函数损失降低到设定的图像二值化阈值,停止训练,输出图片分类模型;
构建显著性预测模型的具体方法为:
步骤一.选取图片数据,人工筛选分类,构建数据集,根据图片所属类别人工定义图片的显著区域;
步骤二.根据不同类别,对图片人工进行像素级的标注;
步骤三.以VGG16模型作为基础网络模型分类框架,构建显著性预测模型;VGG16网络是该领域熟知的经典分类网络;
步骤四.利用构建的数据集,对设计的显著检测网络进行训练,使用softmax函数确定图片的显著区域,其中,softmax函数可表示为:
其中,zi表示显著性预测模型最后一层第i个位置神经元的输出,K为图像像素个数,p(i)表示待处理图片第i个位置像素预测为显著区域的概率;
步骤五.待显著性预测模型的softmax函数损失降低到设定的图像二值化阈值,停止训练,输出显著性预测模型。
2.如权利要求1所述的一种图片自动裁剪方法,其特征在于,所述判断待处理图片的图片比例是否与要求输出比例是否合适的具体方法为:
设置输出比例的波动范围,判断待处理图片的图片比例是否在输出比例的波动范围内,若待处理图片的图片比例不在输出比例的波动范围内,按照待处理图片的图片比例将待处理图片缩小或放大,将待处理图片的较长边统一缩放为固定大小,反之,不执行缩小或放大的操作。
3.如权利要求1所述的一种图片自动裁剪方法,其特征在于,所述执行裁切操作时,进一步精确调整所述裁剪框在待裁剪图片中的位置的方法为:
使用裁切框扫描待处理图片的显著特征图;
裁切框扫描显著特征图的每一个位置,确保较重要区域全部包含在裁切框内;
使用公式(1)计算裁切框在每个位置的显著性得分Score;
其中,裁切框包含较重要区域条件下,w1,w2表示裁剪框的横向可变动范围;h1,h2表示裁剪框的纵向可变动范围;i,j分别表示待处理图像的横纵坐标位置;
确定得分最高的位置作为裁切框的最终位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世纪开元智印互联科技集团股份有限公司,未经世纪开元智印互联科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811255476.4/1.html,转载请声明来源钻瓜专利网。