[发明专利]一种基于卷积神经网络和递归自动编码器模型的场景识别方法有效
申请号: | 201910470014.2 | 申请日: | 2019-05-29 |
公开(公告)号: | CN110188827B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 花福军;陆文斌;张应福;周正斌;李成伟 | 申请(专利权)人: | 创意信息技术股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 递归 自动 编码器 模型 场景 识别 方法 | ||
本发明公开了一种基于卷积神经网络和递归自动编码器模型的场景识别方法,包括:构建卷积神经网络,构建递归自动编码器,数据预处理和场景预测分类;构建卷积神经网络,是利用大规模场景数据集构建并改进卷积神经深度网络;构建递归自动编码器,是利用卷积神经网络提取的图像特征和场景标签构建并改进递归自动编码器;数据预处理,是将图像进行数据增强的操作,同时将场景的文本标签实现嵌入操作完成数据预处理;场景预测分类,构建预测图像场景分类器,将图像特征输入训练完成的模型中进行场景预测分类。本发明改进了传统的图像与文本信息的编码模型,提出了一种新的卷积神经网络和递归自动编码器网络的结合方法,能够显著的提升场景识别的效果。
技术领域
本发明涉及图像场景理解领域,尤其涉及一种基于卷积神经网络和递归自动编码器模型的场景识别方法。
背景技术
如何准确、有效的识别输入图像中的场景,已经成为一个重要的研究课题。在传统的图像理解算法技术中,图像分类,相似图像索引是主要的研究方向。图像分类问题需要更好的获得输入图像的特征向量,并基于特征向量学习优化。传统的算法中使用常见的图像特征是HOG特征。HOG特征是将归一化的图像分割成若干个像素块,计算每个像素块的亮度梯度并将所有的像素块的亮度梯度进行串联。传统的图像分类算法包括KNN(k-NearestNeighbor)和SVM(Support Vector Machine)两种主要的方法。
在传统的图像分类算法常使用的全局特征有Gabor特征,LBP特征,HOG梯度方向直方图,GIST特征等特征,局部特征有SIFT特征(Scale Invariant Feature Transform),SURF特征(Speeded Up Robust Features),DAISY特征等。特征描述子和特征检测子关系相对紧密,其中检测子越多,图像特征提取的时间越长,相应的噪声也会增多,检测子少的情况下,有效的特征匹配也会减少。
(1)KNN算法:
KNN算法的主旨思想是寻找与测试图像中的最相似的图像的,后在最相似的图片组中进行交叉验证,得出测试图像最高的概率值得标签值。两张图像的相似度之间的计算被称为曼哈顿距离,计算所有的像素块的差距,最后计算出两张图像的距离。通过度量图像之间的差异,利用该种思想的分类器实现比较简单,并且训练学习的没有大量的时间花销,但测试时间复杂度巨大,效率偏低。
(2)SVM分类器:
SVM分类器是上世纪60年代被提出的一种按照监督学习方式对输入数据进行二元分类的广义线性分类器。经过多年的发展包括了多种衍生算法和模型,比如多分类SVM,最小二乘法SVM,支持向量回归等模型。SVM在众多模式识别的研究领域中被广泛应用,比如图像识别和文本分类等。SVM的经典结构的思路是使用一个超平面将不同的类别分开,并让难区分的特征点尽可能的表现出最大的差距。
SVM模型展现出小样本数据规模即可提取数据中的非线性关系结构,且解决在繁多的神经网络结构中进行选择和调优问题,高维问题得到解决。而SVM模型不具有普适性,需要具体问题具体解决,模型的核函数选择繁琐,并且计算复杂度高,不适用大规模数据等问题。
基于现有方法的缺陷,需要一种新的卷积神经网络和递归自动编码器网络的结合方法,来实现显著提升场景识别效果。
发明内容
为了解决上述问题,本发明提出一种基于卷积神经网络和递归自动编码器模型的场景识别方法。
一种基于卷积神经网络和递归自动编码器模型的场景识别方法,包括:构建卷积神经网络,构建递归自动编码器,数据预处理和场景预测分类;
所述构建卷积神经网络,是利用大规模场景数据集构建并改进卷积神经深度网络;
所述构建递归自动编码器,是利用卷积神经网络提取的图像特征和场景标签构建并改进递归自动编码器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创意信息技术股份有限公司,未经创意信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910470014.2/2.html,转载请声明来源钻瓜专利网。