[发明专利]一种基于区域池化和特征融合的深度学习图像多标记分类方法在审

申请号：	201910019115.8	申请日：	2019-01-09
公开（公告）号：	CN109740686A	公开（公告）日：	2019-05-10
发明（设计）人：	孙远;李宏	申请（专利权）人：	中南大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	410083 湖南***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于区域池化和特征融合的深度学习图像多标记分类方法，其步骤为：1)对待处理图像进行候选区域提取，生成不同尺度的候选区域；2)将候选区域通过预训练的卷积神经网络的卷积部分提取感兴趣特征图，生成不同尺度的多通道感兴趣特征图3)将不同尺度的感兴趣特征图进行区域池化，使得不同尺寸的感兴趣特征图变成相同尺寸；4)将多个相同尺寸的感兴趣特征图进行融合，生成最后的特征向量；5)将特征融合后的特征向量进入分类器，预测出图像中含有物体的概率；本发明基于卷积神经网络，并加入区域池化和特征融合，不仅提供了在卷积神经网络里进行特征融合的方法，而且提供了一个高精度图像多标记的方法，方便研究人员和工程应用人员在实际应用中提高图像分类效果。
搜索关键词：	感兴趣特征特征融合区域池卷积神经网络候选区域多标记特征向量学习图像尺度高精度图像处理图像工程应用图像分类多通道分类器分类卷积图像融合概率预测应用研究
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于区域池化和特征融合的深度学习图像多标记分类方法，其特征在于，包含以下步骤：步骤1)：对待处理图像进行候选区域提取；利用候选框算法从图片中提取出若干不同尺寸的候选区域P∈N×W^l×H^l(l＝1,2....N)，供后续步骤处理；其中N是候选区域的数量，W^l和H^l分别是候选区域的长度和宽度，每个候选区域的尺度不同；步骤2)：根据步骤1)得到的候选区域P∈N×W^l×H^l(l＝1,2....N)，进入预训练好的卷积神经网络的卷积部分，生成不同尺度的多通道感兴趣特征图F∈N×C×w^l×h^l(l＝1,2....N)；其中N是感兴趣特征图数量，C为感兴趣特征图通道数，w^l和h^l分别是单个特征通道的长度和宽度；可采用预训练卷积神经网络，对候选区域进行特征提取，生成具有高度抽象特征的感兴趣特征图；步骤3)：根据步骤2)得到的感兴趣特征图F∈N×C×w^l×h^l(l＝1,2....N)进行区域池化，生成尺度相同的感兴趣特征图；w^l×h^l表示每个感兴趣特征图的长度和宽度，将其所有的感兴趣特征图的尺寸归一化为w′×h′，归一化后的感兴趣特征图为：F∈N×C×w′×h′；步骤4)：根据步骤3)得到的若干归一化的感兴趣特征图F∈N×C×w′×h′进行特征融合，生成一个具有高度特征抽象的特征向量，V∈T；其中T表示物体的种类数；步骤5)：根据步骤4)得到的特征向量，进入分类器分类，预测出标记向量p∈T；预测向量p的每一个位置pⁱ表示含有物体i的概率；设定阈值θ，pⁱ若超过阈值θ即含有物体i。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中南大学，未经中南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910019115.8/，转载请声明来源钻瓜专利网。

上一篇：用户流失的特征分析方法、预测方法、装置、设备及介质
下一篇：一种基于DLAE的发酵过程故障监测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于区域池化和特征融合的深度学习图像多标记分类方法在审

专利文献下载