[发明专利]基于图像语义理解的图像裁切方法、系统、设备和介质在审
申请号: | 202010206880.3 | 申请日: | 2020-03-23 |
公开(公告)号: | CN111462121A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 罗超;黄小虎;吉聪睿;李巍 | 申请(专利权)人: | 上海携程商务有限公司 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06T5/50;G06N3/04;G06N3/08 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;张冉 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图像 语义 理解 方法 系统 设备 介质 | ||
本发明公开了基于图像语义理解的图像裁切方法、系统、设备和介质,基于图像语义理解的图像裁切方法包括以下步骤:获取图像语义分割模型;将待裁切图像输入至所述图像语义分割模型中,以得到图像语义分割结果;根据所述图像语义分割结果获取所述待分割图像的感兴趣区域;获取所述感兴趣区域的重心;以所述感兴趣区域的重心为裁切中心,获取裁切窗口,并对所述待裁切图像进行裁切。本发明基于图像语义理解的方法对图像进行裁切,确保裁切后的图像主体更加完整。
技术领域
本发明涉及图像语义理解、图像分割技术领域,特别涉及一种基于图像语义理解的图像裁切方法、系统、设备和介质。
背景技术
图像作为一种直接、高效的展现方式,对用户体验、订单转化有着直接、重要的影响。尤其是酒店图像的展现方式,对用户体验、订单转化有着更重要的影响。通常情况下,酒店在后端上传的图片,到前端展示页面时,会根据不同的展示页面,将图像切成对应的不同尺寸。具体来讲就是,APP(Application,应用程序)中不同展示页面的图像往往以不同的纵横比切图展示。当前的切图算法直接以原图中心为图像裁切点,剪裁较为粗糙,造成切图后关键内容和关键目标的丢失,容易给用户造成误导,用户体验较差。
发明内容
本发明要解决的技术问题是为了克服现有技术基于图像中心裁切方法使目标主体展示不完整的缺陷,提供一种基于图像语义理解的图像裁切方法、系统、设备和介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供一种基于图像语义理解的图像裁切方法,所述基于图像语义理解的图像裁切方法包括:
获取图像语义分割模型;
将待裁切图像输入至所述图像语义分割模型中,以得到图像语义分割结果;
根据所述图像语义分割结果获取所述待裁切图像的感兴趣区域;
获取所述感兴趣区域的重心;
以所述感兴趣区域的重心为裁切中心,获取裁切窗口,并对所述待裁切图像进行裁切。
较佳地,所述获取图像语义分割模型的步骤包括:
获取图像,对所述图像进行缩放,并将所述图像通过骨干网络进行特征提取,以得到特征图像;所述骨干网络包括多层CNN网络结构;
基于所述特征图像,进行特征融合,以得到融合特征图像;
对所述融合特征图像进行卷积操作,并通过softmax函数获取每个维度的最大概率值,以得到待训练的图像语义分割模型;
获取待训练的图像,并将图像输入至所述待训练的图像语义分割模型中进行训练,以得到图像语义分割模型。
较佳地,所述基于所述特征图像,进行特征融合,以得到融合特征图像的步骤包括:
对所述特征图像,采用四组不同感受野的池化层进行池化操作,以得到对应的四组第一特征图像;
将所述四组第一特征图像连接到1×1×C/4的卷积核,分别进行卷积,以得到对应的四组第二特征图像;
对所述四组第二特征图像,采用双线性差值法进行采样操作,以得到对应的四组第三特征图像;
基于所述四组第三特征图像和所述特征图像,依据通道维度连接,以得到所述融合特征图像。
较佳地,所述根据所述图像语义分割结果获取所述待裁切图像的感兴趣区域的步骤包括:
对于不同类别的待裁切图像对应预设不同的感兴趣类别;
所述图像语义分割结果包括所述待裁切图像中每个像素点的类别,以及根据不同像素点的类别划分出的不同区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海携程商务有限公司,未经上海携程商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010206880.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序