[发明专利]一种基于图像显著性和迁移学习的图像场景分类方法有效
申请号: | 202010390009.3 | 申请日: | 2020-05-09 |
公开(公告)号: | CN111626149B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 宋建新;傅宁 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V20/20 | 分类号: | G06V20/20;G06V10/74;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210023 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 显著 迁移 学习 场景 分类 方法 | ||
本发明公开了一种基于图像显著性和迁移学习的图像场景分类方法,包括以下步骤:1、提取不同场景的样本图像,将图像缩放后形成图像集;2、提取图像集中每幅图像的显著性区域;3、将步骤2得到的每幅图像的显著性区域的图像放大后构建显著性图像集,并将其按比例划分训练集和测试集;4、基于通用的VGG16模型建立场景分类网络模型,进行迁移学习操作;5、用步骤3得到的训练集和测试集训练并测试步骤4搭建的网络;6、用步骤4建立和步骤5训练得到的网络实施图像场景分类;本发明利用深度迁移学习,有效解决了实际应用中训练样本不足导致判别性能不足的问题,其次,本发明采用显著性区域提取来处理数据集,显著提高了场景分类的效率和准确度。
技术领域
本发明涉及图像处理方法,具体涉及一种基于图像显著性和迁移学习结合的图像场景分类方法。
背景技术
场景分类是计算机视觉领域重要的研究方向,场景图像的类间相似性和类内差异性使得场景分类极具挑战性。
场景分类的核心在于对图像特征的提取。传统方法使用尺度不变特征变换SIFT、颜色直方图、方向梯度直方图HOG、局部二值模式LBP等直接对图像提取特征描述子,需要人为去设计符合目标识别的特征,耗费大量的人力。如果人工特征不能够抽象出本质完备的定义,又容易导致泛化性能不足的问题。而深度学习的方法摒弃了人为选择特征描述子,采用了训练深度网络模型的方式来对图像自动提取特征,一定程度上节省了人力。然而,为了得到泛化性能良好的深度学习网络模型,需要大量的数据进行训练,训练样本数据的不足给实际应用带来了困难;
另一方面,图像数据量大,特别是高分辨率图像,场景可能复杂,但能引起人视觉注意的区域往往有限,如果直接用原图像进行场景分类计算,计算量巨大,浪费计算资源,运算时间长,复杂的特征也会扰乱场景分类。
发明内容
发明目的:为了解决现有技术存在的问题,本发明的目的是提供一种基于图像显著性和迁移学习结合的图像场景分类方法,能够有效快速实现场景分类。
技术方案:一种基于图像显著性和迁移学习的图像场景分类方法,包括以下步骤:
(1)提取不同场景的样本图像,将图像缩放后形成图像集;
(2)提取图像集中每幅图像的显著性区域;
(3)将步骤(2)得到的每幅图像的显著性区域的图像放大后构建显著性图像集,并将其按比例划分训练集和测试集;
(4)基于通用的VGG16模型建立场景分类网络模型,进行迁移学习操作;
(5)用步骤(3)中得到的训练集和测试集训练并测试步骤(4)搭建的网络;
(6)用步骤(4)建立和步骤(5)训练得到的网络实施图像场景分类。
进一步的,步骤(2)具体包括以下内容:
(2-1)建立图像坐标系,以图像左上角为坐标系原点,单位为像素;
(2-2)将图像划分为格子状初始候选区域;
(2-3)采用Selective Search算法,根据颜色、纹理、大小和填充的相似度对步骤(2-2)得到的区域进行聚合操作,得到不相似的候选区域集合;
(2-4)采用滑动窗口机制搜索图像中物体密度最大区域位置;
(2-5)将滑动窗口处于物体密度最大区域位置的图像区域作为整幅图像的显著性区域。
进一步的,步骤(2-4)具体包括以下内容:
(2-4-1)确定滑动窗口尺寸;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010390009.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自清洁式户外广告牌
- 下一篇:一种触控结构、触控屏及电子装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序