[发明专利]一种基于特征融合的图像识别方法在审
申请号: | 201910938732.8 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110674884A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 李雪;李锐;于治楼 | 申请(专利权)人: | 山东浪潮人工智能研究院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 37100 济南信达专利事务所有限公司 | 代理人: | 郗艳荣 |
地址: | 250100 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征融合 图像识别 分类能力 人工设计 数据集 图像 结构化信息 传统分类 深度特征 特征表达 特征提取 特征语义 细节信息 信息丢失 学习训练 次网络 中间层 网络 融合 学习 分类 | ||
1.一种基于特征融合的图像识别方法,其特征在于,包括以下步骤:
第一步,深度特征提取
合理划分数据集,利用训练集训练深度网络,优化网络参数,利用验证集防止训练模型过拟合,得到训练后的深度特征提取模型;利用深度学习的优势,在小规模数据集中提取网络中间层特征对图像进行表示;
第二步,人工设计特征提取
为避免选取深层次网络造成的信息丢失问题,利用深度网络模型提取的图像深度特征,提取图像的人工设计特征,即颜色和边缘方向特征描述符CEDD特征;
第三步,特征融合
将深度特征提取提取到的特征和人工设计特征提取到的特征进行特征融合,兼顾高层次的结构化信息以及底层细节信息,从而使特征语义性更高,分类能力更强。
第四步,完成预测分类工作。
2.根据权利要求1所述的基于特征融合的图像识别方法,其特征在于:所述第一步中,深度学习通过大量,数据训练将相对不独立的特征经过多层学习后形成更加结构化的特征,包括像素pixels,边缘edges和对象objects。
3.根据权利要求2所述的基于特征融合的图像识别方法,其特征在于:所述深度特征提取中,CNN编码过程包括以下步骤:
(1)输入图像x,将图像x分割成多个卷积层;
(2)分别提取各个卷积层图像的宽度w,高度h和通道的个数c;
(3)对卷积层图像进行全连接层处理,得到神经网络分类特征;
(4)对卷积层图像进行最大池化处理,得到机器学习分类特征;
(5)将原始深度神经网络的全连接层替换为池化层输出特征信息,作为图像的深度特征表达用于分类。
4.根据权利要求3所述的基于特征融合的图像识别方法,其特征在于:
所述步骤(1)中,采用sparse autoencoder,即自动稀疏编码的方式,自动提取图像特征,将输入图像的激活度用隐层激活度表示,在输出层还原,得到压缩后的特征,且信息熵减小,适用于图像分类。
5.根据权利要求1所述的基于特征融合的图像识别方法,其特征在于:所述第二步中,颜色和边缘方向特征描述符CEDD特征的提取过程分为24维颜色特征提取和6维纹理特征提取两部分。
6.根据权利要求5所述的基于特征融合的图像识别方法,其特征在于:所述24维颜色特征提取采用HSV模型,H表示色调,S表示饱和度,V表示亮度;其提取过程为:首先提取图像的RGB颜色信息,即红、绿、蓝三基色的亮度,然后进行RGB-HSV的模型转换,得到像素点的HSV值进行过滤,先经过10-bins模糊过滤,再经过24-bins过滤,最后得到颜色特征信息的直方图。
7.根据权利要求5所述的基于特征融合的图像识别方法,其特征在于:所述6维纹理特征包括一维无边缘信息和五个边缘方向,分别为垂直方向v、水平方向h、45度方向d-45、135度方向d-135和无方向nd;通过判断每个区域纹理信息所属于的直方图区域,即可得出一个6维直方图作为纹理特征。
8.根据权利要求7所述的基于特征融合的图像识别方法,其特征在于:所述6维纹理特征提取过程中运用到YIQ色彩空间的Y值,即亮度信息;将图片分成若干区域,在每个区域内,再依次分为四个子区域,根据YIQ公式计算出小区域内像素的灰度值的平均值,然后经过5个数字滤波器过滤后,由纹理特征的计算规则判断每个小区域的纹理类别即可。
9.根据权利要求8所述的基于特征融合的图像识别方法,其特征在于:所述纹理特征的计算规则为:
首先设定4个阈值,T0=14,检测是否含有边缘信息;T1=0.68,检测是否含有方向信息;T2=T3=0.98,检测是否含有其他四个方向的信息;
如果mmax≧T0,则认为该区域包含纹理信息,此时可以计算其他各个方向的值,否则,则认为该区域不含有纹理信息,纹理直方图第一维的值增加1;
其中,mmax为各个子区域内所判定的各个方向上的取值ni中的最大值,归一化处理得到每个子区域内的图像边缘信息为i分别为v,h,d-45,d-135和nd。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮人工智能研究院有限公司,未经山东浪潮人工智能研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910938732.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于k近邻和概率选择主动学习方法
- 下一篇:一种病灶匹配方法及装置