[发明专利]一种基于卷积神经网络的花卉图像检索方法有效
申请号: | 201810312552.4 | 申请日: | 2018-04-09 |
公开(公告)号: | CN108829692B | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 邹腊梅;金留嘉;张松伟;李长峰;陈婷;李晓光;熊紫华;杨卫东 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 42201 华中科技大学专利中心 | 代理人: | 曹葆青;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 花卉 卷积神经网络 图像 图像数据集 查询图像 图像检索 构建 相似性比较 分布特征 类别信息 随机图像 特征向量 图像数据 节点数 分类 准确率 向量 检索 | ||
本发明公开了一种基于卷积神经网络的花卉图像检索方法,包括:构建带有类别信息的花卉图像数据集,并使用随机图像变换方法处理花卉图像以增强花卉图像数据集;构建基于VGG16的花卉分类深度卷积神经网络模型VGG‑F,其中,FC1、FC2和分类层的节点数分别为1024、256和花卉类别总数;通过模型VGG‑F的FC2分别提取待查询图像和花卉图像数据集中每一个花卉图像的特征向量,并进行相似性比较,得到最相似的2N个花卉图像;分别计算待查询图像和得到的2N个花卉图像中每一个花卉图像的HSV颜色分布特征向量,并进行比较,得到最相似的N个花卉图像。本发明基于卷积神经网络,有效提高了花卉检索的准确率。
技术领域
本发明属于图像处理、计算机视觉技术和模式识别的交叉领域,更具体地,涉及一种基于卷积神经网络的花卉图像检索方法。
背景技术
传统的花卉图像检索是基于文本的,用户通过输入花卉的名称进行检索。而由于花卉图像种类繁多、颜色形状多变,普通人难以准确认识和描述花卉图像,导致用户查询时输入的文本描述难以符合用户实际的查询需求。
基于内容的图像检索能有效地利用图像自身特征,减少用户的主观描述。近些年来以VGG为代表的卷积神经网络模型等在计算机视觉领域,如图像分类、目标识别等领域实现了较好的效果。而现有的基于VGG卷积神经网络模型的花卉图像检索方法仅使用形状、颜色、纹理、关键点等简单的图像低层特征,检索结果的准确率较低。基于SIFT(ScaleInvariant Feature)等关键点描述的特征,对光照、视角、尺度等变换有一定的鲁棒性,但是其计算复杂度大,且对于花卉图像描述能力有限。对于颜色特征,传统的颜色直方图统计只能反映图像的总体特征,只能够表达图像颜色信息,如图像全局颜色信息,但是无法描述其他信息,所以直接用于花卉检索时准确率比较低。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种基于卷积神经网络的花卉图像检索方法,其目的在于,结合花卉图像的深度学习特征和图像颜色特征对花卉图像进行相似性比较,以提高花卉图像检索的准确率。
为实现上述目的,本发明提供了一种基于卷积神经网络的花卉图像检索方法,包括如下步骤:
(1)构建带有类别信息的花卉图像数据集,并使用随机图像变换方法处理花卉图像以增强花卉图像数据集,从而防止后续模型训练时过拟合;
(2)构建基于VGG16的花卉分类深度卷积神经网络模型VGG-F,并使用Adam优化算法优化模型VGG-F的参数的学习训练;模型VGG-F中,第一个全连接层(FC1)的节点数为1024个,第二个全连接层(FC2)的节点数为256个,分类层的节点数为花卉图像数据集中的花卉类别总数;
(3)通过模型VGG-F的第二个全连接层(FC2)分别提取待查询图像和花卉图像数据集中每一个花卉图像的特征向量,并进行相似性比较,提取花卉图像数据集中与待查询图像最相似的2N个花卉图像作为初步检索结果;其中,N为正整数;
(4)分别计算待查询图像和初步检索结果中每一个花卉图像的HSV颜色分布特征向量,并进行比较,提取初步检索结果中与待查询图像最相似的N个花卉图像作为检索结果;检索结束。
进一步地,花卉图像数据集中,花卉类别总数Nc不超过100,以同时获得较高的检索准确率和训练准确率。
进一步地,检索结果中,所包含的花卉图像数量N的取值范围为:10<N<40,以保证在获得较高检索准确率的同时尽量节省存储空间。
进一步地,步骤(1)中,用于处理花卉图像以增强花卉图像数据集的随机图像变换方法包括:随机-10°~10°的旋转、-0.15~0.15倍最小图片边长的水平移位、-0.15~0.15倍最小图片边长的竖直移位、镜像对称变换或者其中两种或多种变换的组合,以及将花卉图像缩放到224×224大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810312552.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序