[发明专利]基于弱监督信息的深度学习图像目标映射及定位方法有效

申请号：	201810390879.3	申请日：	2018-04-27
公开（公告）号：	CN108764292B	公开（公告）日：	2022-03-18
发明（设计）人：	田永鸿;李宗贤;史业民;曾炜;王耀威	申请（专利权）人：	北京大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04;G06N3/08;G06V10/764;G06V10/82
代理公司：	北京市商泰律师事务所 11255	代理人：	黄晓军
地址：	100871 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于弱监督信息的深度学习图像目标映射及定位方法。该方法包括：使用带有类别标签的图像数据分别训练两个深度卷积神经网络框架，得到分类模型M1和分类模型M2，并获取全局带参可学习池化层参数；使用新的分类模型M2对测试图像进行特征提取，得到特征图，根据特征图通过特征类别映射及阈值法得到初步定位框；使用选择性搜索方法对测试图像进行候选区域提取，使用分类模型M1筛选类别出候选框集合；对初步定位框和候选框进行非极大值抑制处理，得到测试图像最终的目标定位框。本发明引入全局带参可学习池化层，能够学习得到关于目标类别j的更好的特征表达，并通过使用选择性特征类别映射的方式，有效得到图像中目标物体的位置信息。
搜索关键词：	基于监督信息深度学习图像目标映射定位方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于弱监督信息的深度学习图像目标映射及定位方法，其特征在于，包括如下步骤：S1，使用人工标注带有类别标签的图像数据训练深度卷积神经网络框架，得到分类模型M1；S2，在所述深度神经网络框架中删去卷积层后所有的全连接层，并加入一个全局带参可学习池化层和最后的分类全连接层，得到新的深度卷积神经网络框架；S3，使用人工标注带有类别信息标签的图像数据训练所述新的深度卷积神经网络框架，得到新的分类模型M2，并获取全局带参可学习池化层参数；S4，对于新输入的测试图像，使用所述新的分类模型M2进行特征提取，得到最后一个卷积层后的特征图，对所述特征图与全局带参可学习池化层参数进行内积后求和、非线性函数激活和列向量相乘后求和操作，得到最终的特征映射图，根据所述最终的特征映射图通过阈值法得到初步定位框；S5，对于所述新输入的测试图像，使用选择性搜索方法进行候选区域提取，再使用所述分类模型M1筛选出类别属于目标物体的置信度大于75％的候选框集合；S6，对所述初步定位框和所述候选框进行非极大值抑制处理，得到所述测试图像最终的目标定位框。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京大学，未经北京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810390879.3/，转载请声明来源钻瓜专利网。

上一篇：模型异动的原因确定方法及装置和电子设备
下一篇：基于玉米果穗对称性的行数自动检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于弱监督信息的深度学习图像目标映射及定位方法有效

专利文献下载