[发明专利]一种基于竞争重构学习的半监督异常检测方法有效
申请号: | 201811317051.1 | 申请日: | 2018-11-07 |
公开(公告)号: | CN109543727B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 周水庚;田凯;关佶红 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06N3/04 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 竞争 学习 监督 异常 检测 方法 | ||
1.一种基于竞争重构学习的半监督异常检测方法,异常检测问题描述如下:假设已知有m个正样本,n个未标注的样本,需要对未标注样本进行分类,检测出异常数据;其特征在于,
首先,构建一个编码器、两个解码器;通过两个解码器对数据重构进行竞争学习,使得正样本解码器对于正样本的重构效果要比负样本解码器好,同样地负样本解码器对于异常数据的重构效果要比正样本解码器好,整个学习的过程中标签动态分配,至学习收敛,即得到正负样本的标注;其中:
(1)所述编码器,由多层神经网络组成,为全连接网络、卷积神经网络或循环神经网络;功能是将数据从原始特征空间映射到低维子空间,通过正则化的手段将正负样本进行一定程度的分离;同时,正负样本共享同一个编码器;
(2)所述正样本解码器,同样由多层神经网络组成,为全连接网络、卷积神经网络或循环神经网络;用于将样本从低维特征空间重构回原始特征空间;正样本解码器的输出维度与样本数据本身维度一致;编码器与解码器的网络结构是对称的;
(3)所述负样本解码器,与正样本解码器类似,其结构与正样本解码器相同,或者不同,根据对数据的先验知识进行选择;
算法具体步骤如下:
步骤1,将已知的训练数据集中正样本与待标注的未标注测试样本进行混合,并进行数据预处理;
步骤2,将所有样本打乱顺序,每次取一批样本输入到编码器中进行编码;
步骤3,对于编码后的样本,所有已知训练数据的正样本分配到正样本解码器中进行解码,对于未标注样本,根据两个解码器的重构误差进行选择分配;其中重构误差定义如下:
模型的竞争学习优化目标函数如下:
其中,
为第j个样本的预测标签;为正样本,为未标注样本;为正样本解码器重构结果;为负样本解码器重构结果;为正样本解码器,为负样本解码器;
步骤4,计算优化目标函数关于模型参数的导数,并进行反向传播更新参数;参数更新的优化算法为随机梯度下降(SGD)算法;
步骤5,重复步骤2、步骤3和步骤4,直到训练收敛;最终得到的y中,如果,对应的那些就是异常数据。
2.根据权利要求1所述的基于竞争重构学习的半监督异常检测方法,其特征在于,步骤1中所述的数据预处理,包括高维数据分辨率较高的图像使用预训练的卷积神经网络模型VggNet或ResNet进行特征提取,提取这些网络的全连接的前一层的特征,并进行数据标准化处理,减均值除标准差。
3. 根据权利要求1所述的基于竞争重构学习的半监督异常检测方法,其特征在于,所述的 编码器和解码器,根据不同的数据时空结构选择不同的网络类型:如果数据是属性是一维的,则使用全连接网络;如果数据具有二维空间结构并且属性之间是局部相关的,则选择卷积神经网络;如果数据是时序的,且前后时间节点相关,则选择循环神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811317051.1/1.html,转载请声明来源钻瓜专利网。