[发明专利]一种基于标签传播的人工免疫检测器训练方法在审
申请号: | 202110783814.7 | 申请日: | 2021-07-12 |
公开(公告)号: | CN113378997A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 陈文;康明;顾守珂 | 申请(专利权)人: | 四川大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 张秀敏 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 传播 人工免疫 检测器 训练 方法 | ||
本发明公开了一种基于标签传播的人工免疫检测器训练方法,利用标签传播过程,将样本标记从少量带标记样本传播给未标记样本,得到扩展后的已标记样本集合;将标签传播过程中产生错误的标签传播视作样本噪声,利用噪声学习理论,对扩展后的已标记样本集合进行评估;将扩展后的已标记样本集合中通过了评估得到的正类样本集S加入免疫检测器训练样本集合,训练产生新的正类免疫检测器。解决了传统免疫检测器训练对完备正类训练样本集的依赖问题,在已标记正类样本数量不足的情况下仍然能有效产生正类免疫检测器;缩短了检测器训练时间,提高了对正类样本的检测准确率。
技术领域
本发明涉及人工智能技术领域,具体的说,是一种基于标签传播的人工免疫检测器训练方法。
背景技术
人工免疫系统(Artificial Immune System, AIS)是受生物免疫机制启发而来的新型智能系统。AIS利用训练成熟的免疫检测器对输入系统中的数据样本进行分类,将样本划分为正常或异常类别。由于AIS具有分布式、自组织、自适应,以及自学习等特性,被广泛应用于网络入侵检测、疾病诊断、设备故障检测等异常检测领域。否定选择算法是人工免疫系统的产生免疫检测器的基础算法,该算法通过模拟T细胞的成熟机制生成成熟检测器以区分自体self(正类)和非自体non-self(负类)。否定选择算法具有无需先验知识、只需正类样本即可完成训练等优点。然而,传统的否定选择算法尚存在生成效率低,对正类训练样本完备性要求过高等困难。
如图1所示,传统的检测器训练算法NSA(Negative Selection Algorithm)训练过程首先收集完备的正类样本作为正类训练集S,然后随机产生大量的候选(未成熟)检测器D0,并与S中的正类样本进行比较,删除识别了任意正类训练样本的候选检测器,余下的检测器变为成熟检测器D。NSA的检测过程如图2所示,D中检测器在检测过程中与被检测样本进行比较,若样本与D中的任意检测器匹配,则该样本被标记为负类。由于D中的检测器只匹配负类,其产生的检测器也被称为负类检测器。从NSA的训练过程中可以看出,NSA需要完备的正类训练样本集S对候选检测器进行充分训练,以保证检测过程的准确率。然而,随着S规模的增加,训练时间也会随之增长。Forrest等人的研究表明,单个未成熟检测器通过否定选择的概率为(1-Pm)|S|,其中Pm是检测器与样本匹配的概率,|S|是正类训练集大小。因此,|S|越大,产生一个成熟检测器越困难。而当错误率期望值为Pf时,需要产生-ln(Pf)/(Pm*(1-Pm)|S|)个候选检测器。由此可见,NSA的时间复杂度随着正类训练集规模的增大呈指数级增长,严重影响了算法的运行效率。
传统的检测器训练算法NSA应用于网络入侵检测,系统故障诊断,疾病诊断等应用领域时,NSA依赖大量的由人工进行标注的已标记正类样本对候选检测器进行筛选,筛选过程需要候选检测器与已标记样本进行逐一匹配,以筛选出不会错误覆盖任意正类样本的候选检测器,该过程导致NSA效率过低。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110783814.7/2.html,转载请声明来源钻瓜专利网。