[发明专利]基于图像语义理解的图像裁切方法、系统、设备和介质在审
申请号: | 202010206880.3 | 申请日: | 2020-03-23 |
公开(公告)号: | CN111462121A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 罗超;黄小虎;吉聪睿;李巍 | 申请(专利权)人: | 上海携程商务有限公司 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06T5/50;G06N3/04;G06N3/08 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;张冉 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图像 语义 理解 方法 系统 设备 介质 | ||
1.一种基于图像语义理解的图像裁切方法,其特征在于,所述基于图像语义理解的图像裁切方法包括:
获取图像语义分割模型;
将待裁切图像输入至所述图像语义分割模型中,以得到图像语义分割结果;
根据所述图像语义分割结果获取所述待裁切图像的感兴趣区域;
获取所述感兴趣区域的重心;
以所述感兴趣区域的重心为裁切中心,获取裁切窗口,并对所述待裁切图像进行裁切。
2.如权利要求1所述的基于图像语义理解的图像裁切方法,其特征在于,所述获取图像语义分割模型的步骤包括:
获取图像,对所述图像进行缩放,并将所述图像通过骨干网络进行特征提取,以得到特征图像;所述骨干网络包括多层CNN网络结构;
基于所述特征图像,进行特征融合,以得到融合特征图像;
对所述融合特征图像进行卷积操作,并通过softmax函数获取每个维度的最大概率值,以得到待训练的图像语义分割模型;
获取待训练的图像,并将图像输入至所述待训练的图像语义分割模型中进行训练,以得到图像语义分割模型。
3.如权利要求2所述的基于图像语义理解的图像裁切方法,其特征在于,所述基于所述特征图像,进行特征融合,以得到融合特征图像的步骤包括:
对所述特征图像,采用四组不同感受野的池化层进行池化操作,以得到对应的四组第一特征图像;
将所述四组第一特征图像连接到1×1×C/4的卷积核,分别进行卷积,以得到对应的四组第二特征图像;
对所述四组第二特征图像,采用双线性差值法进行采样操作,以得到对应的四组第三特征图像;
基于所述四组第三特征图像和所述特征图像,依据通道维度连接,以得到所述融合特征图像。
4.如权利要求1所述的基于图像语义理解的图像裁切方法,其特征在于,所述根据所述图像语义分割结果获取所述待裁切图像的感兴趣区域的步骤包括:
对于不同类别的待裁切图像对应预设不同的感兴趣类别;
所述图像语义分割结果包括所述待裁切图像中每个像素点的类别,以及根据不同像素点的类别划分出的不同区域;
将与所述待裁切图像对应的感兴趣类别相匹配的区域确定为所述感兴趣区域。
5.如权利要求1所述的基于图像语义理解的图像裁切方法,其特征在于,所述以所述感兴趣区域的重心为裁切中心,获取裁切窗口,并对所述待裁切图像进行裁切的步骤包括:
基于所述感兴趣区域的重心,根据前端展示页面尺寸,计算裁切窗口的宽和高;
多次移动所述裁切窗口,并计算每次移动后所述裁切窗口的四个顶点到所述感兴趣区域的重心的距离之和;
选取所述距离之和为最小值时所对应的所述裁切窗口,并将待裁切图像按照选取的所述裁切窗口进行剪切。
6.如权利要求5所述的基于图像语义理解的图像裁切方法,其特征在于,所述基于所述感兴趣区域的重心,根据前端展示页面尺寸,计算裁切窗口的宽和高的步骤包括:
获取所述待裁切图像的宽、高、宽高比以及所述前端展示页面的宽、高、宽高比;
依据裁切窗口宽、高的计算公式计算裁切窗口宽、高;
所述裁切窗口宽、高的计算公式如下:
若R0R1,W2=H0×R1,H2=H0;
若R0R1,W2=W0,H2=W0/R1;
公式中,W2表示裁切窗口宽,H2裁切窗口高,R0表示待裁切图像的宽高比,R1表示前端展示页面的宽高比,H0表示待裁切图像的高,W0表示待裁切图像的宽。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海携程商务有限公司,未经上海携程商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010206880.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序