[发明专利]一种基于主动学习的显著性检测方法有效
申请号: | 201910609780.2 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110443257B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 张立和;闵一璠 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06V10/46 | 分类号: | G06V10/46;G06V10/774;G06V10/764;G06V10/26;G06K9/62 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于人工智能技术领域,提供了一种基于主动学习的显著性检测方法,主动学习的思路运用到了显著性检测领域,通过考虑样本的不确定性与多样性从未标记样本集中选择出最利于模型训练的样本加入训练集,训练得到最终的KSR模型,由该模型输出测试样本的初始显著图。之后,为了优化显著图的目标边界,又设计了一种超像素级的后处理方法进一步提升性能。本发明降低了标注成本,同时减少了训练集的冗余,使得实验效果相较于原始KSR模型有了很大提升。同时通过对比实验表明本发明方法的性能优于许多经典算法。 | ||
搜索关键词: | 一种 基于 主动 学习 显著 检测 方法 | ||
【主权项】:
1.一种基于主动学习的显著性检测方法,其特征在于,步骤如下:(1)首先,从MSRA数据库中随机选取500张图像加入训练集L中作为初始训练集,分别生成所有图像的区域候选分割,并提取所有区域候选分割的区域CNN特征;(2)定义区域候选分割的正负样本,设计一个自信值去衡量样本相对于真值图前景和背景的打分,自信值为:该分数提前计算两个分值A和C,A是准确度分数,C是覆盖度分数,其中而其中Oi代表第i个样本的目标候选分割,G代表该图像的真值图;其中,ξ是用来平衡准确度分数和覆盖度分数的权重;在本方法中,设定自信值高于0.9的样本被认为是正样本,自信值小于0.6的样本被确定为负样本;因为在计算自信值时发现正样本的个数远远小于负样本的个数,所以使用所有的正样本,随机选择与正样本数量相同的负样本;为进行排序支持向量机训练,将所有正负样本组成正负样本对,定义正样本减负样本为正样本对,反之为负样本对;利用公式:进行排序支持向量机和子空间学习联合训练,训练得到一个排序器KSR,该排序器对样本的区域候选分割进行显著性排序,排名靠前的与前景相似度大;其中w是排序支持向量机的排序系数;式中是逻辑损失函数,a是损失函数参数,e为指数函数;φ(xi)代表样本的特征xi通过核映射后的特征;p是样本对xin和xjn的约束数目;(in,jn)表明样本对是第n对约束的下标;yn∈{+1,‑1}表示样本是属于同一类还是不同类,或者说是否同时属于前景或背景;L∈Rl×d(l<d)是学习到的映射矩阵,l是初始特征维数,d是映射后的特征维度,μ和λ则代表正则化参数;利用主动学习挑选训练样本;首先利用上述初始化生成的模型对未标记样本池中所有样本的目标候选分割进行显著性排序,由si=wTPki得到排序分数,为简化联合训练的计算引入L=PφT(X),其中P∈Rl×N,N是样本个数,φT(X)是核运算,在化简过程中,引入核函数;利用公式将所有排序分数si归一化,代表排序分数归一化后分数,smin代表该图像排序分数集中最小的排序分数,smax代表该图像排序分数集中最大的排序分数;找出所有图像的目标候选分割的归一化排序分数在0.4至0.9之间的图像Xp代表选择出的目标候选分割组成的集合,X代表该图像所有的目标候选分割组成的集合;通过公式计算该图像目标候选分割的排序分数在0.4至0.9之间的个数占所有目标候选分割的比例β,其中card(X)代表该图像所有的目标候选分割数目,card(XP)代表集合Xp中的目标候选分割数目;将此分数作为每张图像的不确定值;这样,得到一个关于所有样本池中未标记样本的不确定值集合,选择其Β={β1,β2,…,βn}中高不确定度的样本人工标记后加入训练集,通过公式进行每一次选择,其中μ0为不确定值集合B的均值,δ是集合的标准差,λ0是权重参数,选取λ0=1.145;设计每一次选择不确定度β大于μ0+λ0δ的样本组成集合Quc;对图像Quc应用密度聚类算法,获得参数ε=0.05,MinPts的大小设定为2,当圆心邻域内样本为2或以上归为一类;聚类后,获得高密度的样本簇C={c1,c2,…cn},和只有1个孤立样本的簇O={o1,o2,…om},最终图像集Quc被分成:Quc={ci,i=1,2,...n}∪{oi,i=1,2,...m};通过公式从每一个高密度的簇ct中选择其中不确定度最大的样本Ut,除此之外,还选择所有孤立样本加入候选集Q中,此类样本点可增加训练模型的泛化能力;最终候选集为Q={Ut,t=1,...n}∪{Oi,i=1,...m};样本集Q代表了每次通过同时考虑不确定性和多样性设计的选择模型选择出的样本,通过人工标记后加入训练集L中;(3)将上述工作选择的样本集Q进行人工标记,之后加入到训练集L中,利用更新后的训练集L再次训练一个排序器KSR,之后在验证集上验证此次训练的模型的性能,之后不断重复步骤(2),直到模型性能变化较小或性能下降,选择上一次迭代选择的训练集作为最终训练集,训练的模型作为最终的训练模型,由模型对每张测试图像的区域候选分割进行显著性排序,选取排名前16位的区域候选分割进行加权融合,得到该图像的显著图Mp;(4)提出一种在超像素级别上的处理方法,实现优化边界的目的;首先利用SLIC的超像素分割算法,设定分割的超像素块数量分别为100、150和200,用来构成图像i的超像素集SPi,分别提取每一个超像素块的CNN特征xj;将由步骤(3)得到的显著图Mp进行二值化作为先验显著图Ei;确定超像素的正负样本,为了使置信度最高,将超像素中完全位于先验显著图Ei前景区域的超像素构成正样本集POi,将超像素中完全位于先验显著图Ei的背景区域的超像素构成负样本集Ni;将正负样本集中的样本构成正负样本对,利用公式去自训练一个关于图像i的模型KSRi;对于该模型KSRi,利用公式si=wTPki对图像所有的超像素进行打分,将所有的超像素进行排序S={s1,s2,…sn},分数越高越接近前景,反之分数越低越接近背景;利用公式求得超像素中每个像素的得分,并将所有分数归一化到0‑1之间,最后加权融合得到超像素级别合成的显著图Ms;最终显著图通过公式M=w1×Mp+w2×MS得到,其中M为最终显著图,Mp为原显著图,Ms为超像素级显著图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910609780.2/,转载请声明来源钻瓜专利网。