[发明专利]基于图像上下文信息的场景识别方法及装置有效
申请号: | 201811091826.8 | 申请日: | 2018-09-19 |
公开(公告)号: | CN109446897B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 鲁继文;周杰;袁博;程晓娟 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图像 上下文 信息 场景 识别 方法 装置 | ||
1.一种基于图像上下文信息的场景识别方法,其特征在于,包括以下步骤:
将预设图像划分为多个图像块,以提取每个图像块的图像块特征;
根据所述每个图像块的图像块特征通过显著性模块生成序列信息,以得到图像块在语义上的相关关系;
根据所述图像块在语义上的相关关系对所述每个图像块及其上下文信息进行编码,以得到上下文信息特征,进一步包括:利用长短时记忆网络获取具有处理时序信息的特性;加入门模块,利用所述长短时记忆网络过滤掉所述图像块中不具有判别性能的特性;借助所述长短时记忆网络存储对所述图像块及所述上下文信息进行编码;以及
获取全局表观信息,并根据所述全局表观信息和所述上下文信息特征得到特征表达信息,以得到场景识别结果。
2.根据权利要求1所述的基于图像上下文信息的场景识别方法,其特征在于,所述将预设图像分化为多个图像块,进一步包括:
将训练集和测试集中所有预设图像归一化到相同尺寸大小;
将归一化处理后的所述预设图像通过滑动窗口分割成所述多个图像块;
利用卷积神经网络提取所述每个图像块的图像块特征。
3.根据权利要求1所述的基于图像上下文信息的场景识别方法,其特征在于,所述相关关系的计算公式为:
f=relu(WvV+Whht-1+Weet-1)
其中,f是通过感知器融合了图像块特征V,长短时记忆网络隐层特征h以及图像语义特征e,W是对应感知器的参数,t为当前时刻,ht-1为前一时刻隐层特征,et-1为前一时刻上下文特征,Wv为图像块特征的对应感知器参数,Wh为长短时记忆网络隐层特征的对应感知器参数,We为图像语义特征的对应感知器参数是对softmax函数的具体表示,f是感知器的融合特征,Wi为关注第i个图像块时的权重参数,Wj表示关注第j个图像块时的权重参数,L代表图像块的个数,νi为第i个区域块对应的区域特征,α代表下一时刻模块所关注的图像块的概率,αi代表下一时刻关注第i个图像块的概率,L是所有图像块的数量,z被视为下一时刻图像块的概率特征,通过设置T次的迭代,模块会输出序列特征{z1,z2...zT},zt分别与zt-1和zt+1在语义层面存在相关关系。
4.根据权利要求1所述的基于图像上下文信息的场景识别方法,其特征在于,所述全局表观信息利用卷积神经网络对整张图像进行特征提取,所述上下文信息特征基于所述图像块进行获取。
5.一种基于图像上下文信息的场景识别装置,其特征在于,包括:
提取模块,用于将预设图像划分为多个图像块,以提取每个图像块的图像块特征;
生成模块,用于根据所述每个图像块的图像块特征通过显著性模块生成序列信息,以得到图像块在语义上的相关关系;
编码模块,用于根据所述图像块在语义上的相关关系对所述每个图像块及其上下文信息进行编码,以得到上下文信息特征,所述编码模块进一步包括:
获取单元,用于利用长短时记忆网络获取具有处理时序信息的特性;
过滤单元,用于加入门模块,利用所述长短时记忆网络过滤掉所述图像块中不具有判别性能的特性;
编码单元,用于借助所述长短时记忆网络存储对所述图像块及所述上下文信息进行编码;
获取模块,用于获取全局表观信息,并根据所述全局表观信息和所述上下文信息特征得到特征表达信息,以得到场景识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811091826.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置