[发明专利]一种场景图像识别方法和场景图像识别设备有效
申请号: | 201510389185.4 | 申请日: | 2015-07-03 |
公开(公告)号: | CN104933420B | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 姜宇宁;李百恩 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 董巍;高伟 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 场景 图像 识别 方法 设备 | ||
1.一种场景图像识别方法,其特征在于,所述方法包括:
步骤S101:提取图像的特征,以形成特征图;
步骤S102:利用多个随机模板将所述特征图切分成多个独立的通道,所述多个独立的通道包括等数量的子图,且所述多个独立的通道中的每个通道包括形状大小不同的子图;以及
步骤S103:将所述多个独立的通道进行池化,以形成新的特征图。
2.如权利要求1所述的场景图像识别方法,其特征在于,所述多个随机模板是预先定义的。
3.如权利要求1或2所述的场景图像识别方法,其特征在于,在所述步骤S103之后还包括步骤S104:将所述新的特征图通过全连接层以进行分类。
4.如权利要求3所述的场景图像识别方法,其特征在于,所述全连接层中的每个节点是基于所述新的特征图中的所有特征值的,或者是基于所述新的特征图中的某部分的特征值的。
5.如权利要求3所述的场景图像识别方法,其特征在于,在所述步骤S104之后还包括步骤S105:将分类结果通过最优胜出策略做出判断。
6.一种场景图像识别设备,其特征在于,所述设备包括:
特征提取模块,用于提取图像的特征,以形成特征图;
随机空间切分模块,用于利用多个随机模板将所述图像切分成多个独立的通道,所述多个独立的通道包括等数量的子图,且所述多个独立的通道中的每个通道包括形状大小不同的子图;以及
空间池化模块,用于将所述多个独立的通道进行池化,以形成新的特征图。
7.如权利要求6所述的场景图像识别设备,其特征在于,所述多个随机模板是预先定义的。
8.如权利要求6或7所述的场景图像识别设备,其特征在于,还包括全连接分类模块,用于将所述新的特征图通过全连接层以进行分类。
9.如权利要求8所述的场景图像识别设备,其特征在于,所述全连接层中的每个节点是基于所述新的特征图中的所有特征值的,或者是基于所述新的特征图中的某部分的特征值的。
10.如权利要求8所述的场景图像识别设备,其特征在于,还包括最优胜出策略模块,用于将分类结果通过最优胜出策略做出判断。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510389185.4/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序