[发明专利]一种基于区域池化和特征融合的深度学习图像多标记分类方法在审
申请号: | 201910019115.8 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109740686A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 孙远;李宏 | 申请(专利权)人: | 中南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于区域池化和特征融合的深度学习图像多标记分类方法,其步骤为:1)对待处理图像进行候选区域提取,生成不同尺度的候选区域;2)将候选区域通过预训练的卷积神经网络的卷积部分提取感兴趣特征图,生成不同尺度的多通道感兴趣特征图3)将不同尺度的感兴趣特征图进行区域池化,使得不同尺寸的感兴趣特征图变成相同尺寸;4)将多个相同尺寸的感兴趣特征图进行融合,生成最后的特征向量;5)将特征融合后的特征向量进入分类器,预测出图像中含有物体的概率;本发明基于卷积神经网络,并加入区域池化和特征融合,不仅提供了在卷积神经网络里进行特征融合的方法,而且提供了一个高精度图像多标记的方法,方便研究人员和工程应用人员在实际应用中提高图像分类效果。 | ||
搜索关键词: | 感兴趣特征 特征融合 区域池 卷积神经网络 候选区域 多标记 特征向量 学习图像 尺度 高精度图像 处理图像 工程应用 图像分类 多通道 分类器 分类 卷积 图像 融合 概率 预测 应用 研究 | ||
【主权项】:
1.一种基于区域池化和特征融合的深度学习图像多标记分类方法,其特征在于,包含以下步骤:步骤1):对待处理图像进行候选区域提取;利用候选框算法从图片中提取出若干不同尺寸的候选区域P∈N×Wl×Hl(l=1,2....N),供后续步骤处理;其中N是候选区域的数量,Wl和Hl分别是候选区域的长度和宽度,每个候选区域的尺度不同;步骤2):根据步骤1)得到的候选区域P∈N×Wl×Hl(l=1,2....N),进入预训练好的卷积神经网络的卷积部分,生成不同尺度的多通道感兴趣特征图F∈N×C×wl×hl(l=1,2....N);其中N是感兴趣特征图数量,C为感兴趣特征图通道数,wl和hl分别是单个特征通道的长度和宽度;可采用预训练卷积神经网络,对候选区域进行特征提取,生成具有高度抽象特征的感兴趣特征图;步骤3):根据步骤2)得到的感兴趣特征图F∈N×C×wl×hl(l=1,2....N)进行区域池化,生成尺度相同的感兴趣特征图;wl×hl表示每个感兴趣特征图的长度和宽度,将其所有的感兴趣特征图的尺寸归一化为w′×h′,归一化后的感兴趣特征图为:F∈N×C×w′×h′;步骤4):根据步骤3)得到的若干归一化的感兴趣特征图F∈N×C×w′×h′进行特征融合,生成一个具有高度特征抽象的特征向量,V∈T;其中T表示物体的种类数;步骤5):根据步骤4)得到的特征向量,进入分类器分类,预测出标记向量p∈T;预测向量p的每一个位置pi表示含有物体i的概率;设定阈值θ,pi若超过阈值θ即含有物体i。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910019115.8/,转载请声明来源钻瓜专利网。