[发明专利]基于混合深度结构的场景识别方法有效

申请号：	201610554626.6	申请日：	2016-07-14
公开（公告）号：	CN106203354B	公开（公告）日：	2019-04-12
发明（设计）人：	胡昭华;姜啸远;钱坤;王珏	申请（专利权）人：	南京信息工程大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/02
代理公司：	南京纵横知识产权代理有限公司 32224	代理人：	董建林
地址：	210044 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于混合深度结构的场景识别方法。改进先前混合深度识别框架，运用到场景识别的任务中，使用深度自编码器自动提取局部图像块特征代替传统混合深度网络的局部特征提取层，得到图像块高级局部特征。同时引入空间信息改进场景识别的局部特征编码层，最后使用深度判别网络识别场景，完善混合深度混合场景识别框架，使改进的混合深度场景在形式上和识别准确率上接近卷积神经网络的，计算效率上高于深度卷积神经网络。此外针对场景数据类内差异性和类间相似性有选择扩充场景数据，构建鲁棒性高，适应小数据集的深度混合场景识别模型。
搜索关键词：	基于混合深度结构场景识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.基于混合深度结构的场景识别方法,其特征在于，包括如下步骤：步骤一：在图片中随机抽取若干图像块后，对图像块标准化；步骤二：从数据集中随机抽取若干图片，对每张图片抽取图像块，将图片块不计类别混合，归一化后分别训练两个深度直连卷积自编码器网络；步骤三：深度直连卷积自编码特征提取，编码过程中的任一层都可视为特征层，特征层输出有多个特征映射矩阵，串联特征映射矩阵相同位置的值得到图像块的局部特征；步骤四：将步骤三提取的局部特征对应图片中的位置，将其划分到各层级对应的子区域中，然后从金字塔基层向上依次对各自子区域内的深度自编码特征费舍尔编码，依次串联，再次PCA降维和标准化，得到空间金字塔费舍尔特征；步骤五：将步骤四中得到表示费舍尔特征的图片，通过改变图片对应图像块的组成间接生成新数据，扩充场景数据集；步骤六：采用深度网络对空间金字塔费舍尔特征分类，该深度网络包括全连接层和输出层，将步骤五得到的扩充后的场景数据集中图片对应的空间金字塔费舍尔编码作为第一层全连接层输入。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京信息工程大学，未经南京信息工程大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201610554626.6/，转载请声明来源钻瓜专利网。

上一篇：一种基于计算机视觉技术的视力测定系统
下一篇：一种室内场景火苗检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于混合深度结构的场景识别方法有效

专利文献下载