[发明专利]一种基于卷积深度置信网络的图像分类检索方法在审
申请号: | 201910329040.3 | 申请日: | 2019-04-23 |
公开(公告)号: | CN110119455A | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 王文卿;焦鹏飞;刘涵;刘伟 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 燕肇琪 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像分类 检索 查询图像 灰度图片 类别标号 图像数据 训练集 卷积 置信 预处理 高阶统计特征 检索技术 可区分性 输出图像 图像检索 图像使用 不变性 测试集 描述子 构建 排序 网络 图像 测试 分类 改进 统一 学习 图片 | ||
本发明公开一种基于卷积深度置信网络的图像分类检索方法。具体实施步骤为:步骤1:将图像数据集中的图片进行预处理,得到尺寸统一的灰度图片,将所述灰度图片随机划分为两部分,一部分为训练集,另一部分为测试集;构建一个CDBN模型;步骤2:用训练集对CDBN模型进行训练;步骤3:将测试集中的图像作为查询图像,用训练好的CDBN模型对查询图像进行分类,输出图像的类别标号;步骤4:对图像数据集中相同类别标号的图像使用hog特征描述子进行类内检索排序,最终得到图像检索的结果。本发明中CDBN模型可以获得具有局部不变性和能够学习高阶统计特征,表达能力和可区分性更强,能够改进和提升图像分类检索技术。
技术领域
本发明属于计算机视觉技术领域,涉及一种基于卷积深度置信网络的图像分类检索方法。
背景技术
图像分类检索技术中,图像的表示和图像的特征表达是其关键问题所在,合理的描述和表达图像的视觉内容,是图像分类检索任务中需要解决的首要问题。早期的很多研究工作中,普遍使用的是图像的颜色、纹理或形状等全局特征,如颜色直方图、纹理能量、轮廓矩等等。虽然全局特征可以较好的表示图像的总体特点,计算复杂度较低,但是由于其无法有效区分前景目标和背景信息,不能够准确描述图像的细节信息,因此区分度较差,仅适用于特定应用背景下的图像分类检索。近年来,图像局部特征由于具有更优的描述能力和鲁棒性,成为图像视觉特征研究的热点。图像局部特征指的是在图像中根据某种属性定义的有区别与其邻域的特征模式,主要包括特征点的局部特征和基于区域的局部特征描述,实质上就是一些在各种成像条件下能够稳定、重复出现并且具有良好可区分的一些点或区域,即兴趣点(Interest point)或感兴趣区域(Region of Interest)。但通常情况下,一幅图像中可能检测出多个特征区域或特征点,因此在描述形式上通常都是以高维向量的形式存在,即“图像局部特征集”。然而这种“局部特征集”的描述形式不适合于传统的图像分类和检索应用。随着模式识别和机器学习的快速发展,图像的视觉特征的研究焦点逐渐转移到在学习系统的帮助下实现图像的特征提取,进一步促进了图像分类和检索技术的发展。
目前,在计算机视觉领域中,深度学习模型通过无监督的方式去学习到数据中的层次特征表达,不同于传统的人工设计的特征,这样减少了人工设计特征的巨大工作量,并且包含了图像的语义信息,即通过一个大量标注的图像数据来训练深度神经网络,而图像的标注代表了图像的类别,也反映了人类视觉中对图像内容的理解。深度学习模型作为一种强大的特征学习器,其学习过程一般是以无监督和有监督结合的方式完成,其不仅能够自主提取图像,并且能够相对准确得学习到人类对图像的理解方式,进而训练得到的深度学习模型可以为图像提供一个类似于人类视觉系统理解的语义描述,更有助于图像分类和图像检索的应用。
目前,卷积神经网络(CNN)在图像分类领域展现出了卓越的性能,CNN对图像的位移、缩放以及其他旋转变化等具有良好的适应性,但是其忽略了图像中的高阶统计特征;而在深度置信网络(DBN)模型中,其在提取图像高阶特征方面具备良好的性能,但忽略了图像中的局部不变性,对图像的一些局部变化较为敏感。并且DBN对于给定的每一个位置都要进行权值学习,这种冗余的设计使其很难适用于整幅图像,可能会存在图像中部分有效信息丢失等情况,并且这种设计需要训练大量的权值参数,计算复杂度极高。
发明内容
本发明的目的是提供一种基于卷积深度置信网络的图像分类检索方法,能够改进和提升图像分类检索技术。
本发明所采用的技术方案是,
一种基于卷积深度置信网络的图像分类检索方法,具体实施步骤为:
步骤1:将图像数据集中的图片进行预处理,得到尺寸统一的灰度图片,将所述灰度图片随机划分为两部分,一部分为训练集,另一部分为测试集;
构建一个CDBN模型;
步骤2:用训练集对CDBN模型进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910329040.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:证据管理方法及装置
- 下一篇:检索图像的方法及装置