[发明专利]一种针对模型拟合中不平衡数据的采样方法有效
申请号: | 201910451911.9 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110163865B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 肖国宝;汪涛;徐海平 | 申请(专利权)人: | 闽江学院 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06T7/33 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈明鑫;蔡学俊 |
地址: | 350108 福建省*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 模型 拟合 不平衡 数据 采样 方法 | ||
1.一种针对模型拟合中不平衡数据的采样方法,其特征在于,包括以下步骤:
步骤S1:提取图像特征数据,并构成数据集;
步骤S2:从数据集中随机采样一个最小子集,作为代表性采样子集,并初始化采样集合;
步骤S3:从数据集中随机采样一个最小子集,作为采样子集;
步骤S4:根据代表性采样子集和采样子集更新采样集合;
步骤S5:循环步骤S3至步骤S4,直至满足预设终止条件;
步骤S6:去除多余的模型假设,得到最终采样集合;
步骤S7:将最终采样集合作为模型拟合的输入数据,以完成最后的参数估计和图像分割;
所述步骤S3具体为:
步骤S31:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θi,其中i表示第i次采样,并计算该模型假设θi的权重,权重公式如下:
式中,s(θi)表示模型假设θi的内点尺度,表示模型假设θi和数据点xt之间的距离,为核函数,b(θi)为宽度;N为数据总数;
所述步骤S4具体为:
步骤S41:计算θi与采样集合中的每个代表性采样子集的关系,计算公式如下:
其中Inlier(θi)和表示相应模型假设的内点集合,和分别表示两个集合的交集和并集,|·|表示集合的成员个数;如果认为它们对应同一个模型实例;
步骤S42:若θi与采样集合中一个代表性采样子集对应同一个模型实例,那么进一步对比它们的权重,以更新采样集合;如果那么θi加入到采样集合中,并取代作为一个代表性采样子集;反之,将θi抛弃,不作为采样集合的成员;
步骤S43:如果采样集合中没有找到θi对应同一个模型实例的代表性采样子集,那么将θi加入到采样集合中,并作为代表性采样子集的一个新成员。
2.根据权利要求1所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S2具体为:
步骤S21:从数据集中随机采样一个最小子集;
步骤S22:评估最小子集的模型假设参数θ1,并计算该模型假设θ1的权重,权重公式如下:
式中,s(θ1)表示模型假设θ1的内点尺度,表示模型假设θ1和数据点xt之间的距离,为核函数,b(θ1)为宽度;X={xt}为数据集,N为数据总数;
步骤S23:将采样的第一个模型假设θ1作为采样集合的第一个成员,并作为一个代表性采样子集其中j表示采样集合的第j个成员,此处j=1。
3.根据权利要求1所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S5具体为:判定采样个数是否达到预设阈值,如果达到则终止循环,并得到采样集合的模型假设θ={θ1,θ2,…,θm};反之回到步骤步骤S3,做下一步采样。
4.根据权利要求1所述的一种针对模型拟合中不平衡数据的采样方法,其特征在于,所述步骤S6具体为:
步骤S61:对于采样集合中的所有模型假设θ={θ1,θ2,…,θm},它们相应的权重为W={w1,w2,…,wm};
步骤S62:设定每个模型假设的权重wk与最大权重的跨度:ψk=max(W)-wk,计算其相应的概率:
步骤S63:计算该权重集合的熵作为阈值衡量模型假设的质量:
步骤S64:通过熵选择模型假设:θ′={θk|-log p(ψk)>ζ},得到的θ′作为最终的采样集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910451911.9/1.html,转载请声明来源钻瓜专利网。