[发明专利]一种半监督的显著对象检测方法有效

申请号：	201710702593.X	申请日：	2017-08-16
公开（公告）号：	CN107506792B	公开（公告）日：	2020-09-29
发明（设计）人：	崔静;谭凯;王嘉欣	申请（专利权）人：	广西荷福智能科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04
代理公司：	成都华风专利事务所(普通合伙) 51223	代理人：	徐丰;张巨箭
地址：	530000 广西壮族自治区南宁市高新区***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种监督显著对象检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种半监督的显著对象检测方法，基于改进的faster rcnn的RPN网络模型，方法包括：S1：对图片中对象框进行初始分割，作为对象的初始ground truth；S2：设置网络；S3：训练网络；S4：对训练图片进行显著对象预测；S5：对训练图片进行超像素分割及超像素级的平滑，并进行二值化操作；S6：利用步骤S5得到的二值化的对象前景谱作为ground truth；S7：重复步骤S3~S6。本发明提出了包含显著预测模块与对象检测模块的联合网络，将显著预测模块的输出与分类模块的中间特征层进行融合，进行联合优化。这种网络结构有效地利用了对象的轮廓信息，辅助网络更加准确地检测出显著对象。

技术领域

本发明涉及显著对象检测的卷积神经网络领域，尤其涉及一种半监督的显著对象检测方法。

背景技术

人类有从图片中感知感兴趣对象的能力。在计算机视觉领域，这种感兴趣的对象被称作显著对象。计算机模仿人的这种能力，从图片中检测出显著对象被称作显著对象检测。显著对象检测已经成为一个热门的领域，因为它可以辅助其它图像处理任务，具有广泛的应用，其应用领域包括对象检测、对象分割、场景理解、图像分类和检索等。

在计算机视觉领域，有许多显著对象检测方法。这些方法可以分为两类：一类是无监督的显著对象检测方法，另一类是有监督的显著对象检测方法。传统的无监督显著对象检测方法通常是基于图像的颜色、亮度、纹理等特征，利用局部对比度、全局对比度或者图像边缘的背景信息来检测显著对象。这些方法在设计上通常基于显著对象在图像中的分布假设，并不能很好地适应显著对象的多样性。例如基于局部对比度的方法不能很好地检测出与图片背景差异小的对象，基于图片边缘背景信息的方法不能较好地检测出位于图像边缘的显著对象。另外，对于场景复杂的图像，无监督方法可能无法准确检测出显著对象，效果不够理想。

相比于无监督方法，有监督的方法，如svm、random tree、DNN等，利用标注的图片训练模型并将训练好的模型用于显著对象检测。这些方法展现出了更好的性能。尤其是基于深度神经网络(DNN)的方法，由于深度神经网络在大规模数据上展现出的性能优势，基于深度神经网络的显著对象检测方法进一步提升了显著对象检测的性能。然而，现有基于深度神经网络的显著对象检测方法是全监督的训练模式，这些方法的性能在很大程度上取决于训练数据的规模。训练图片数量过少容易使网络过拟合，导致较差的检测性能；而要达到理想的检测效果，需要几万甚至上百万的训练数据。与此同时，每一张训练图片都需要人工进行像素级标注，标注过程单调乏味且耗时耗力。因此，要收集理想规模的训练数据，是一件需要消耗大量人力和时间的工作。

发明内容

本发明的目的在于克服现有技术的不足，提供一种半监督的显著对象检测方法，解决现有技术采用全监督的训练模式工作量大的问题。

本发明的目的是通过以下技术方案来实现的：一种半监督的显著对象检测方法，基于改进的faster rcnn的RPN网络模型，所述的RPN网络模型包括对象检测模块和显著预测模块；所述的对象检测模块和显著预测模块的输入端共享一个共享卷积层；

所述的显著预测模块包括一个第一卷积层、一个sigmoid层和三个转置卷积层，共享卷积层的输出端经过第一卷积层输出特征谱，所述的特征谱经过sigmoid层得到一张初始显著预测谱s，所述的初始显著预测谱s经过三个转置卷积层的上采样后输出一张显著预测谱sal；在训练阶段，所述的显著预测模块还包括一个在转置卷积层之后的Euclidean损失层；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广西荷福智能科技有限公司，未经广西荷福智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710702593.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一种对动脉粥样硬化斑块进行分类的系统
下一篇：基于弱标注图像的服装识别方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种半监督的显著对象检测方法有效

专利文献下载