[发明专利]图像裁剪预测模型的训练方法、介质、装置及计算设备有效
申请号: | 201910189451.7 | 申请日: | 2019-03-13 |
公开(公告)号: | CN109919156B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 侯晓霞;许盛辉;刘彦东 | 申请(专利权)人: | 网易传媒科技(北京)有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/26;G06V10/774;G06K9/62 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 杨瑾瑾;陈建民 |
地址: | 100084 北京市海淀区西北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 裁剪 预测 模型 训练 方法 介质 装置 计算 设备 | ||
1.一种图像裁剪预测模型的训练方法,其特征在于,包括:
获取原始图像的特征信息及裁剪样本的信息,所述裁剪样本指对原始图像进行裁剪后得到的图像,所述裁剪样本的信息包括:所述裁剪样本的样本分类信息、样本位置信息以及样本宽高比信息;其中,所述样本分类信息表示所述裁剪样本是否包含所述原始图像的关键部分;
将所述特征信息输入所述图像裁剪预测模型;所述图像裁剪预测模型包括至少一个预测通道,每个所述预测通道对应一个样本宽高比的范围;
根据所述图像裁剪预测模型输出的预测图像的信息及所述裁剪样本的信息计算损失函数,采用所述损失函数训练所述图像裁剪预测模型中与所述裁剪样本的样本宽高比信息对应的预测通道。
2.根据权利要求1所述的方法,其特征在于,所述获取原始图像的特征信息包括:
对所述原始图像进行卷积计算,得到所述原始图像的特征映射图,将所述特征映射图作为所述原始图像的特征信息。
3.根据权利要求1或2所述的方法,其特征在于,
所述样本位置信息为所述裁剪样本在所述原始图像中的位置信息;所述预测图像的信息包括:所述预测图像的预测分类信息及预测位置信息;所述预测分类信息为所述预测图像包含所述原始图像的关键部分的可能性;所述预测位置信息为所述预测图像在所述原始图像中的位置信息。
4.根据权利要求3所述的方法,其特征在于,所述根据所述图像裁剪预测模型输出的预测图像的信息及所述裁剪样本的信息计算损失函数,包括:
根据所述样本分类信息及预测分类信息计算分类损失,并根据所述样本位置信息及预测位置信息计算位置损失;
根据所述分类损失及位置损失计算所述损失函数。
5.根据权利要求1或2所述的方法,其特征在于,所述裁剪样本为采用至少一个图像宽高比裁剪所述原始图像所得到的至少一个图像;各个所述图像宽高比处于所述各个图像宽高比的范围之内。
6.一种图像裁剪方法,其特征在于,包括:
获取原始图像的特征信息;
将所述特征信息输入预先训练的图像裁剪预测模型,得到所述原始图像的至少一个预测图像的信息;所述图像裁剪预测模型训练时的裁剪样本为对原始图像进行裁剪后得到的图像,所述裁剪样本的信息包括:所述裁剪样本的样本分类信息、样本位置信息以及样本宽高比信息;其中,所述样本分类信息表示所述裁剪样本是否包含所述原始图像的关键部分;所述图像裁剪预测模型包括至少一个预测通道,每个所述预测通道对应一个样本宽高比的范围;其中,与所述样本宽高比信息对应的预测通道是采用损失函数训练得到的,所述损失函数是根据所述图像裁剪预测模型输出的预测图像的信息及所述裁剪样本的信息计算确定的;
根据所述至少一个预测图像的信息对所述原始图像进行初步裁剪。
7.根据权利要求6所述的方法,其特征在于,所述获取原始图像的特征信息包括:
对所述原始图像进行卷积计算,得到所述原始图像的特征映射图,将所述特征映射图作为所述原始图像的特征信息。
8.根据权利要求6或7所述的方法,其特征在于,
所述至少一个预测图像的信息,包括:至少一个预测图像的预测分类信息及预测位置信息;所述预测分类信息为所述预测图像包含所述原始图像的关键部分的可能性;所述预测位置信息为所述预测图像在所述原始图像中的位置信息;
所述根据所述至少一个预测图像的信息对所述原始图像进行初步裁剪,包括:获取所述预测分类信息最大的预测图像,根据所述获取的预测图像的预测位置信息对所述原始图像进行初步裁剪。
9.根据权利要求8所述的方法,其特征在于,所述图像裁剪预测模型包括至少一个预测通道,每个预测通道对应一个图像宽高比的范围;
所述获取原始图像的特征信息之后,还包括:将对所述原始图像进行裁剪的预设宽高比输入所述图像裁剪预测模型;
所述原始图像的至少一个预测图像的信息包括:由所述图像宽高比的范围包含所述预设宽高比的预测通道输出的信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易传媒科技(北京)有限公司,未经网易传媒科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910189451.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本图像的倾斜角矫正方法及终端
- 下一篇:一种视觉定位方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序