[发明专利]一种基于标签传播的人工免疫检测器训练方法在审

申请号：	202110783814.7	申请日：	2021-07-12
公开（公告）号：	CN113378997A	公开（公告）日：	2021-09-10
发明（设计）人：	陈文;康明;顾守珂	申请（专利权）人：	四川大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	四川省成都市天策商标专利事务所 51213	代理人：	张秀敏
地址：	610000 四***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于标签传播人工免疫检测器训练方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于标签传播的人工免疫检测器训练方法，其特征在于，包括：

步骤S100：利用标签传播过程，将样本标记从少量带标记样本传播给未标记样本，得到扩展后的已标记样本集合；

步骤S200：将标签传播过程中产生错误的标签传播视作样本噪声，利用噪声学习理论，对扩展后的已标记样本集合进行评估；

步骤S300：将扩展后的已标记样本集合中通过了评估得到的正类样本集S加入免疫检测器训练样本集合，训练产生新的正类免疫检测器。

2.根据权利要求1所述的一种基于标签传播的人工免疫检测器训练方法，其特征在于，所述步骤S100具体包括：

步骤S110：令X_L表示初始时已收集到的少量带标记样本数据集，X_L={x₁,x₂,…,x_l}，l为初始时已收集到的少量带标记样本数据集中的样本个数，X_U表示从未标记样本数据集U中随机选出的子集，X_U={x₁,x₂,…,x_u}，X=[X_L∪X_U]^T；设X中样本类别数为s，C表示所有类别的集合，C={c₁,c₂,…,c_s}；

定义规模为l+u行，s列的标签矩阵Y=[Y_L,Y_U]^T，Y中第i行，第j列的元素Y_ij表示X中第i个样本x_i属于第j个类别的概率，1≤i≤l+u，1≤j≤s，Y_L表示X_L中的已标记样本隶属于每个类别的概率，Y_U表示X_U中未标记样本隶属于每个类别的概率，初始时将Y_U中的标签全部设定为0；

步骤S120：令x_i，x_o为X中的任意两个样本：x_i∈X，x_o∈X，x_ik表示样本x_i的第k维属性的值，x_ok代表样本x_o的第k维属性的值，w_io衡量了x_i与x_o之间的相似度：

（1）

其中，D代表样本维数，σ为量化参数；

步骤S130：规模为(l+u)行，(l+u)列的概率传播矩阵P，矩阵P中第i行，第o列的元素P_io代表了将样本x_i的标签传递给样本x_o的概率：

（2）

标签传播过程如下：

步骤A1：初始化迭代轮数t=1，设置期望迭代轮数E_t；

步骤A2：从未标记样本集U中随机选择出固定数量的子集X_U，与初始时已收集到的已标记样本数据集X_L组成X，X=[X_L∪X_U]^T；

步骤A3：初始化Y=[Y_L∪Y_U]^T；

步骤A4：Y_Temp=Y_U；

步骤A5：计算矩阵P与矩阵Y的乘积PY，令Y=PY；

步骤A6：替换Y的前l行为Y_L，保持已标记样本的类别标签不变；