[发明专利]图像裁剪预测模型的训练方法、介质、装置及计算设备有效
申请号: | 201910189451.7 | 申请日: | 2019-03-13 |
公开(公告)号: | CN109919156B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 侯晓霞;许盛辉;刘彦东 | 申请(专利权)人: | 网易传媒科技(北京)有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/26;G06V10/774;G06K9/62 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 杨瑾瑾;陈建民 |
地址: | 100084 北京市海淀区西北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 裁剪 预测 模型 训练 方法 介质 装置 计算 设备 | ||
本发明的实施方式提供了一种图像裁剪预测模型的训练方法、介质、装置及计算设备。该方法包括:获取原始图像的特征信息及裁剪样本的信息;将所述特征信息输入所述图像裁剪预测模型;根据所述图像裁剪预测模型输出的预测图像的信息及所述裁剪样本的信息计算损失函数,采用所述损失函数训练所述图像裁剪预测模型。本发明实施例训练得到的图像裁剪预测模型可以用于图像裁剪过程,使图像裁剪过程耗时较短、计算量较小,尽可能地避免出现裁剪不完整或图像扭曲的情况,并且适用于各种不同内容的图像。本发明实施例还提供一种图像裁剪方法及装置。
技术领域
本发明的实施方式涉及图像裁剪技术领域,更具体地,本发明的实施方式涉及图像裁剪预测模型的训练方法、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
图像裁剪的目的是更改原始图像的尺寸,使裁剪后图像的尺寸、宽高比例符合实际需要。图像裁剪的原则是使裁剪后图像尽量保持原始图像的关键内容,并且整体美观度不受较大影响。
目前存在一些图像裁剪技术。例如,接缝裁剪(Seam Carving)算法是一种典型的裁剪算法,其思想是通过像素移除或者像素增加来达到改变图像宽高比的目的。接缝裁剪算法的缺点是计算量较大,耗时长,并且容易产生图像扭曲。
人脸检测技术和图像显著性检测也常用于图像裁剪。人脸检测技术用于图像裁剪的方法一般为以人脸区域为核心,围绕人脸区域进行裁剪,其缺点是仅适用于含人脸的图像。图像显著性检测一般输出结果为能量图,能量图上的值对应原始图像上相应位置像素的重要程度,因此需要对能量图进一步计算以确定待裁剪图像区域。由于图像显著性区域往往较为分散,较难把握最核心区域,因此裁剪结果中较容易出现裁剪不完整的情况。
发明内容
在本上下文中,本发明的实施方式期望提供一种图像裁剪预测模型的训练方法和装置,以及一种图像裁剪方法和装置。
在本发明实施方式的第一方面中,提供了一种图像裁剪预测模型的训练方法,包括:
获取原始图像的特征信息及裁剪样本的信息;
将所述特征信息输入所述图像裁剪预测模型;
根据所述图像裁剪预测模型输出的预测图像的信息及所述裁剪样本的信息计算损失函数,采用所述损失函数训练所述图像裁剪预测模型。
在本发明的一个实施例中,所述获取原始图像的特征信息包括:对所述原始图像进行卷积计算,得到所述原始图像的特征映射图,将所述特征映射图作为所述原始图像的特征信息。
在本发明的一个实施例中,所述裁剪样本的信息包括:所述裁剪样本的样本分类信息及样本位置信息;所述样本分类信息表示所述裁剪样本是否包含所述原始图像的关键部分;所述样本位置信息为所述裁剪样本在所述原始图像中的位置信息;
所述预测图像的信息包括:所述预测图像的预测分类信息及预测位置信息;所述预测分类信息为所述预测图像包含所述原始图像的关键部分的可能性;所述预测位置信息为所述预测图像在所述原始图像中的位置信息。
在本发明的一个实施例中,所述根据所述图像裁剪预测模型输出的预测图像的信息及所述裁剪样本的信息计算损失函数,包括:
根据所述样本分类信息及预测分类信息计算分类损失,并根据所述样本位置信息及预测位置信息计算位置损失;
根据所述分类损失及位置损失计算所述损失函数。
在本发明的一个实施例中,所述图像裁剪预测模型包括至少一个预测通道,每个预测通道对应一个图像宽高比的范围;
所述裁剪样本为采用至少一个图像宽高比裁剪所述原始图像所得到的至少一个图像;各个所述图像宽高比处于所述各个图像宽高比的范围之内。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易传媒科技(北京)有限公司,未经网易传媒科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910189451.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本图像的倾斜角矫正方法及终端
- 下一篇:一种视觉定位方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序