[发明专利]一种基于竞争重构学习的半监督异常检测方法有效

专利信息
申请号: 201811317051.1 申请日: 2018-11-07
公开(公告)号: CN109543727B 公开(公告)日: 2022-12-20
发明(设计)人: 周水庚;田凯;关佶红 申请(专利权)人: 复旦大学
主分类号: G06V10/774 分类号: G06V10/774;G06V10/82;G06N3/04
代理公司: 上海正旦专利代理有限公司 31200 代理人: 陆飞;陆尤
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 竞争 学习 监督 异常 检测 方法
【权利要求书】:

1.一种基于竞争重构学习的半监督异常检测方法,异常检测问题描述如下:假设已知有m个正样本,n个未标注的样本,需要对未标注样本进行分类,检测出异常数据;其特征在于,

首先,构建一个编码器、两个解码器;通过两个解码器对数据重构进行竞争学习,使得正样本解码器对于正样本的重构效果要比负样本解码器好,同样地负样本解码器对于异常数据的重构效果要比正样本解码器好,整个学习的过程中标签动态分配,至学习收敛,即得到正负样本的标注;其中:

(1)所述编码器,由多层神经网络组成,为全连接网络、卷积神经网络或循环神经网络;功能是将数据从原始特征空间映射到低维子空间,通过正则化的手段将正负样本进行一定程度的分离;同时,正负样本共享同一个编码器;

(2)所述正样本解码器,同样由多层神经网络组成,为全连接网络、卷积神经网络或循环神经网络;用于将样本从低维特征空间重构回原始特征空间;正样本解码器的输出维度与样本数据本身维度一致;编码器与解码器的网络结构是对称的;

(3)所述负样本解码器,与正样本解码器类似,其结构与正样本解码器相同,或者不同,根据对数据的先验知识进行选择;

算法具体步骤如下:

步骤1,将已知的训练数据集中正样本与待标注的未标注测试样本进行混合,并进行数据预处理;

步骤2,将所有样本打乱顺序,每次取一批样本输入到编码器中进行编码;

步骤3,对于编码后的样本,所有已知训练数据的正样本分配到正样本解码器中进行解码,对于未标注样本,根据两个解码器的重构误差进行选择分配;其中重构误差定义如下:

模型的竞争学习优化目标函数如下:

其中,

为第j个样本的预测标签;为正样本,为未标注样本;为正样本解码器重构结果;为负样本解码器重构结果;为正样本解码器,为负样本解码器;

步骤4,计算优化目标函数关于模型参数的导数,并进行反向传播更新参数;参数更新的优化算法为随机梯度下降(SGD)算法;

步骤5,重复步骤2、步骤3和步骤4,直到训练收敛;最终得到的y中,如果,对应的那些就是异常数据。

2.根据权利要求1所述的基于竞争重构学习的半监督异常检测方法,其特征在于,步骤1中所述的数据预处理,包括高维数据分辨率较高的图像使用预训练的卷积神经网络模型VggNet或ResNet进行特征提取,提取这些网络的全连接的前一层的特征,并进行数据标准化处理,减均值除标准差。

3. 根据权利要求1所述的基于竞争重构学习的半监督异常检测方法,其特征在于,所述的 编码器和解码器,根据不同的数据时空结构选择不同的网络类型:如果数据是属性是一维的,则使用全连接网络;如果数据具有二维空间结构并且属性之间是局部相关的,则选择卷积神经网络;如果数据是时序的,且前后时间节点相关,则选择循环神经网络。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811317051.1/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top