[发明专利]一种基于虚拟样本集成学习的图像来源鉴别方法在审
申请号: | 201910470527.3 | 申请日: | 2019-05-31 |
公开(公告)号: | CN110188828A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 王波;张玉涵 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 马庆朝 |
地址: | 116023 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 虚拟样本 集成学习 图像来源 训练样本 鉴别 来源鉴别 准确率 计算机图像处理技术 测试样本分类 技术方案步骤 原始训练样本 扩散 分类结果 基分类器 强分类器 随机生成 整合 样本 相机 并用 | ||
1.一种基于虚拟样本集成学习的图像来源鉴别方法,其特征在于,步骤如下:
S1、提取训练样本LBP特征;
S2、计算每类样本中LBP特征每一维的扩散范围;
S3、在扩散范围内按均匀分布随机生成多组虚拟样本;
S4、集成学习,对虚拟样本分类结果进行整合。
2.如权利要求1所述的基于虚拟样本集成学习的图像来源鉴别方法,其特征在于,步骤S1-S3具体步骤如下:
T1、提取训练集中所有的训练样本和测试样本的LBP特征,
得到:
训练特征样本集:为样本所属的类别,n为每类训练样本数,i=1,…,n为维度为256的行向量;
测试样本集:为样本所属的类别,n为每类测试样本数,i=1,…,m为维度为256的行向量;
对每类训练样本,计算其每一维的数据中心:
其中,n代表样本个数,CL代表每类训练样本的LBP特征每一维的中间值;
T2、计算同一类样本中每一维度间的相关性TSA:
式(2)中,g(k)i,j表示同一类别中样本的特征中两个维度间的相似趋势,若g(k)i,j=1,则表示i和j两个维度间的相似趋势极高,即都在中心点CL的同侧;Si,j表示样本特征不同维度间的相似性,k表示同一类中的第k个样本,i和j分别代表每类训练样本的LBP特征的不同维度;
T3、分别计算每类样本中各维度的欧几里得距离代替样本标准差:
式(4)中取u=2,i为样本特征的维度;
T4、计算扩散后每类样本中各维度边界的式子为:
其中表示同类样本LBP特征每一维中小于数据中心值CL的值的平均欧几里得距离,表示同类样本LBP特征每一维中大于数据中心值CL的值的平均欧几里得距离,
T5、在确定虚拟样本生成范围后,在此范围内基于均匀分布生成值tv;
T6、计算值tv的三角形隶属度函数值MF(tv),在[0,1]上按照均匀分布随机的生成值r,
T7、若r<MF(tv),则tv可以作为合适的虚拟样本V保留下来,生成的虚拟样本V与相应的原始训练样本共享一个类别标签;
T8、重复步骤T5-T7,直到生成足够的虚拟样本,并将保留下来的虚拟样本集加入原始小样本训练集形成新的训练样本。
3.如权利要求2所述的基于虚拟样本集成学习的图像来源鉴别方法,其特征在于,步骤S4具体步骤如下:
U1、生成多组虚拟样本Vi,i=1,…,T,其中T表示虚拟样本组数;
U2、将各组虚拟样本中分别加入原始小样本训练集形成T组新的训练样本;
U3、用这T组训练样本训练出T个基分类器,用这T个基分类器分别对测试样本集进行分类,对于每个测试样本会得到T个伪标签;
U4、对测试样本集中每个测试样本的T个伪标签,用相对多数投票表决法确定测试样本最终的伪标签,伪标签和测试样本的真实标签相同的样本数目与测试样本总数的比值即为来源鉴别准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910470527.3/1.html,转载请声明来源钻瓜专利网。