[发明专利]一种有限有标签样本条件的相机来源鉴别方法在审
申请号: | 201510990808.3 | 申请日: | 2015-12-24 |
公开(公告)号: | CN105631473A | 公开(公告)日: | 2016-06-01 |
发明(设计)人: | 谭跃;王波 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 李宝元;梅洪玉 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种有限样本条件下的相机来源鉴别方法,属于信号与信息处理技术领域。该方法首先对有标签训练样本集进行特征提取。然后利用有标签样本特征训练分类器并对所有样本分类,根据后验概率的排序构成原型集。然后将每个样本在各原型集上的投影向量集成形成集成特征,利用有标签样本形成的集成特征训练分类器,然后对无标签样本进行分类。 | ||
搜索关键词: | 一种 有限 标签 样本 条件 相机 来源 鉴别方法 | ||
【主权项】:
一种有限有标签样本条件的相机来源鉴别方法,其特征在于以下步骤,步骤一:对无标签样本和有标签样本进行特征提取使用已有的来源鉴别特征,利用特征提取算法对无标签样本和有标签样本进行特征提取,得到无标签测试样本集Du和有标签训练样本集Dl;步骤二:构建原型集,实现对有限有标签样本的充分描述将原型集的理论引入到来源鉴别中;样本类别数记为N,从有标签训练样本集中通过k次随机的选取m维构成k个特征子集,记为接下来分别利用这k个特征子集训练SVM分类器,并对多有样本Du和Dl进行分类,获得k个分类结果;对于每个分类器的结果,根据每一类中样本的后验概率对样本进行排序,选择排序靠前的n个样本并加上标签,构成了一个N×n的包含原始训练样本集部分信息的原型集;则k个分类器共获得k个原型集;记为{P1,P2,…,Pk};在上述过程中,在进行排序之前如果样本属于每一类的概率都相同,该样本为噪声样本,应该去除该样本对分类结果的影响,根据最大熵理论等概率条件下熵值最大,其中熵的计算公式如下式所示: 其中p(ci)表示样本属于ci类的概率,根据该式设定阈值e,小于该熵阈值的样本将被当做噪声样本舍去,再将剩余的样本根据样本后验概率对样本进行排序;步骤三:集成映射,将从各个原型集获得的分类信息进行集成;构建原型集的过程中给无标签的样本加上了标签,因此每一个原型集都被认为是一个新的有标签训练样本集;利用这k个原型集分别训练分类器,并对Dl中的每个样本进行分类,则每个样本会在一个分类器上获得属于各类的后验概率,将该后验概率记为向量vi,将k个分类器获得的向量{v1,v2,…,vk}进行集成即可构成集成特征VN×k,1;对所有Dl中样本提取集成特征,构成新的训练样本集,利用该训练样本集训练分类器SVM,并对Du中的无标签样本进行分类;通过上述过程即实现了将多个原型集的类别信息集成的目标,并实现了对无标签样本的有效分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510990808.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于时间序列的计算机数据挖掘聚类方法
- 下一篇:选择图片的方法及装置