[发明专利]一种基于区域池化和特征融合的深度学习图像多标记分类方法在审
申请号: | 201910019115.8 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109740686A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 孙远;李宏 | 申请(专利权)人: | 中南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 感兴趣特征 特征融合 区域池 卷积神经网络 候选区域 多标记 特征向量 学习图像 尺度 高精度图像 处理图像 工程应用 图像分类 多通道 分类器 分类 卷积 图像 融合 概率 预测 应用 研究 | ||
1.一种基于区域池化和特征融合的深度学习图像多标记分类方法,其特征在于,包含以下步骤:
步骤1):对待处理图像进行候选区域提取;利用候选框算法从图片中提取出若干不同尺寸的候选区域P∈N×Wl×Hl(l=1,2....N),供后续步骤处理;其中N是候选区域的数量,Wl和Hl分别是候选区域的长度和宽度,每个候选区域的尺度不同;
步骤2):根据步骤1)得到的候选区域P∈N×Wl×Hl(l=1,2....N),进入预训练好的卷积神经网络的卷积部分,生成不同尺度的多通道感兴趣特征图F∈N×C×wl×hl(l=1,2....N);其中N是感兴趣特征图数量,C为感兴趣特征图通道数,wl和hl分别是单个特征通道的长度和宽度;可采用预训练卷积神经网络,对候选区域进行特征提取,生成具有高度抽象特征的感兴趣特征图;
步骤3):根据步骤2)得到的感兴趣特征图F∈N×C×wl×hl(l=1,2....N)进行区域池化,生成尺度相同的感兴趣特征图;wl×hl表示每个感兴趣特征图的长度和宽度,将其所有的感兴趣特征图的尺寸归一化为w′×h′,归一化后的感兴趣特征图为:F∈N×C×w′×h′;
步骤4):根据步骤3)得到的若干归一化的感兴趣特征图F∈N×C×w′×h′进行特征融合,生成一个具有高度特征抽象的特征向量,V∈T;其中T表示物体的种类数;
步骤5):根据步骤4)得到的特征向量,进入分类器分类,预测出标记向量p∈T;预测向量p的每一个位置pi表示含有物体i的概率;设定阈值θ,pi若超过阈值θ即含有物体i。
2.根据权利要求1所述的一种基于区域池化和特征融合的深度学习图像多标记分类方法,其特征在于,所述步骤1)提到的候选区域提取算法,包括但不限于SelectiveSearch,EdgeBoxes等候选区域提取算法。
3.根据权利要求1所述的一种基于区域池化和特征融合的深度学习图像多标记分类方法,其特征在于,所述步骤2)提到的通过卷积神经网络提取感兴趣特征图的方法,包括但不限于Alexnet,VGG,Resnet等其他卷积神经网络。
4.根据权利要求1所述的一种基于区域池化和特征融合的深度学习图像多标记分类方法,其特征在于,所述步骤3)包括以下步骤:
步骤3.1):将每个wl×hl的感兴趣的特征图划分成w′×h′个子特征图,即采用横纵切分的方法,每个子特征图的大小为:
步骤3.2):将每个子特征图进行最大池化,提取最大值特征点;每个子特征图的最大特征点重组成新的特征图,新的特征图的尺寸为w′×h′;将每个感兴趣特征图进行子特征图划分,最大池化,特征重组,所有的感兴趣特征图归一化为w′×h′。
5.根据权利要求1所述的一种基于区域池化和特征融合的深度学习图像多标记分类方法,其特征在于,所述步骤4)包括以下步骤:
步骤4.1):根据步骤4)得到的归一化感兴趣特征图F∈N×C×w′×h′进入若干层全连接神经网络进行特征提取,生成感兴趣特征向量;先将归一化感兴趣特征图进行一次卷积,卷积核大小为w′×h′,输出为Fc∈N×C′,再进入若干层全连接神经网络,输出为Fs∈N×T,其中N表示感兴趣特征向量个数,T是每个向量的维度;
步骤4.2):根据步骤4.1)得到的多个特征向量Fs∈N×T进行特征融合,生成特征向量V∈T;设定Fs=(t1,t2,.....tN)t1∈N×1,V=(v1,v2,.....vN),则vi=max(t1)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910019115.8/1.html,转载请声明来源钻瓜专利网。