[发明专利]一种基于标签传播的人工免疫检测器训练方法在审
申请号: | 202110783814.7 | 申请日: | 2021-07-12 |
公开(公告)号: | CN113378997A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 陈文;康明;顾守珂 | 申请(专利权)人: | 四川大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 张秀敏 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 传播 人工免疫 检测器 训练 方法 | ||
1.一种基于标签传播的人工免疫检测器训练方法,其特征在于,包括:
步骤S100:利用标签传播过程,将样本标记从少量带标记样本传播给未标记样本,得到扩展后的已标记样本集合;
步骤S200:将标签传播过程中产生错误的标签传播视作样本噪声,利用噪声学习理论,对扩展后的已标记样本集合进行评估;
步骤S300:将扩展后的已标记样本集合中通过了评估得到的正类样本集S加入免疫检测器训练样本集合,训练产生新的正类免疫检测器。
2.根据权利要求1所述的一种基于标签传播的人工免疫检测器训练方法,其特征在于,所述步骤S100具体包括:
步骤S110:令XL表示初始时已收集到的少量带标记样本数据集,XL={x1,x2,…,xl},l为初始时已收集到的少量带标记样本数据集中的样本个数,XU表示从未标记样本数据集U中随机选出的子集,XU={x1,x2,…,xu},X=[XL∪XU]T;设X中样本类别数为s,C表示所有类别的集合,C={c1,c2,…,cs};
定义规模为l+u行,s列的标签矩阵Y=[YL,YU]T,Y中第i行,第j列的元素Yij表示X中第i个样本xi属于第j个类别的概率,1≤i≤l+u,1≤j≤s,YL表示XL中的已标记样本隶属于每个类别的概率,YU表示XU中未标记样本隶属于每个类别的概率,初始时将YU中的标签全部设定为0;
步骤S120:令xi,xo为X中的任意两个样本:xi∈X,xo∈X,xik表示样本xi的第k维属性的值,xok代表样本xo的第k维属性的值,wio衡量了xi与xo之间的相似度:
(1)
其中,D代表样本维数,σ为量化参数;
步骤S130:规模为(l+u)行,(l+u)列的概率传播矩阵P,矩阵P中第i行,第o列的元素Pio代表了将样本xi的标签传递给样本xo的概率:
(2)
标签传播过程如下:
步骤A1:初始化迭代轮数t=1,设置期望迭代轮数Et;
步骤A2:从未标记样本集U中随机选择出固定数量的子集XU,与初始时已收集到的已标记样本数据集XL组成X,X=[XL∪XU]T;
步骤A3:初始化Y=[YL∪YU]T;
步骤A4:YTemp=YU;
步骤A5:计算矩阵P与矩阵Y的乘积PY,令Y=PY;
步骤A6:替换Y的前l行为YL,保持已标记样本的类别标签不变;
步骤A7:F=|YTemp-YU|,若矩阵F中全部的元素之和小于阈值λ,则结束第t轮迭代,输出YU,转步骤A8;否则跳转步骤A4;
步骤A8:令t=t+1,若t>Et,则停止迭代,否则跳转步骤A2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110783814.7/1.html,转载请声明来源钻瓜专利网。