[发明专利]基于混合深度结构的场景识别方法有效
申请号: | 201610554626.6 | 申请日: | 2016-07-14 |
公开(公告)号: | CN106203354B | 公开(公告)日: | 2019-04-12 |
发明(设计)人: | 胡昭华;姜啸远;钱坤;王珏 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/02 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210044 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于混合深度结构的场景识别方法。改进先前混合深度识别框架,运用到场景识别的任务中,使用深度自编码器自动提取局部图像块特征代替传统混合深度网络的局部特征提取层,得到图像块高级局部特征。同时引入空间信息改进场景识别的局部特征编码层,最后使用深度判别网络识别场景,完善混合深度混合场景识别框架,使改进的混合深度场景在形式上和识别准确率上接近卷积神经网络的,计算效率上高于深度卷积神经网络。此外针对场景数据类内差异性和类间相似性有选择扩充场景数据,构建鲁棒性高,适应小数据集的深度混合场景识别模型。 | ||
搜索关键词: | 基于 混合 深度 结构 场景 识别 方法 | ||
【主权项】:
1.基于混合深度结构的场景识别方法,其特征在于,包括如下步骤:步骤一:在图片中随机抽取若干图像块后,对图像块标准化;步骤二:从数据集中随机抽取若干图片,对每张图片抽取图像块,将图片块不计类别混合,归一化后分别训练两个深度直连卷积自编码器网络;步骤三:深度直连卷积自编码特征提取,编码过程中的任一层都可视为特征层,特征层输出有多个特征映射矩阵,串联特征映射矩阵相同位置的值得到图像块的局部特征;步骤四:将步骤三提取的局部特征对应图片中的位置,将其划分到各层级对应的子区域中,然后从金字塔基层向上依次对各自子区域内的深度自编码特征费舍尔编码,依次串联,再次PCA降维和标准化,得到空间金字塔费舍尔特征;步骤五:将步骤四中得到表示费舍尔特征的图片,通过改变图片对应图像块的组成间接生成新数据,扩充场景数据集;步骤六:采用深度网络对空间金字塔费舍尔特征分类,该深度网络包括全连接层和输出层,将步骤五得到的扩充后的场景数据集中图片对应的空间金字塔费舍尔编码作为第一层全连接层输入。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610554626.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于计算机视觉技术的视力测定系统
- 下一篇:一种室内场景火苗检测方法