[发明专利]一种基于竞争重构学习的半监督异常检测方法有效

申请号：	201811317051.1	申请日：	2018-11-07
公开（公告）号：	CN109543727B	公开（公告）日：	2022-12-20
发明（设计）人：	周水庚;田凯;关佶红	申请（专利权）人：	复旦大学
主分类号：	G06V10/774	分类号：	G06V10/774;G06V10/82;G06N3/04
代理公司：	上海正旦专利代理有限公司 31200	代理人：	陆飞;陆尤
地址：	200433 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于竞争学习监督异常检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于竞争重构学习的半监督异常检测方法，异常检测问题描述如下：假设已知有m个正样本，n个未标注的样本，需要对未标注样本进行分类，检测出异常数据；其特征在于，

首先，构建一个编码器、两个解码器；通过两个解码器对数据重构进行竞争学习，使得正样本解码器对于正样本的重构效果要比负样本解码器好，同样地负样本解码器对于异常数据的重构效果要比正样本解码器好，整个学习的过程中标签动态分配，至学习收敛，即得到正负样本的标注；其中：

（1）所述编码器，由多层神经网络组成，为全连接网络、卷积神经网络或循环神经网络；功能是将数据从原始特征空间映射到低维子空间，通过正则化的手段将正负样本进行一定程度的分离；同时，正负样本共享同一个编码器；

（2）所述正样本解码器，同样由多层神经网络组成，为全连接网络、卷积神经网络或循环神经网络；用于将样本从低维特征空间重构回原始特征空间；正样本解码器的输出维度与样本数据本身维度一致；编码器与解码器的网络结构是对称的；

（3）所述负样本解码器，与正样本解码器类似，其结构与正样本解码器相同，或者不同，根据对数据的先验知识进行选择；

算法具体步骤如下：

步骤1，将已知的训练数据集中正样本与待标注的未标注测试样本进行混合，并进行数据预处理；

步骤2，将所有样本打乱顺序，每次取一批样本输入到编码器中进行编码；

步骤3，对于编码后的样本，所有已知训练数据的正样本分配到正样本解码器中进行解码，对于未标注样本，根据两个解码器的重构误差进行选择分配；其中重构误差定义如下：

模型的竞争学习优化目标函数如下：

其中，

为第j个样本的预测标签；为正样本，为未标注样本；为正样本解码器重构结果；为负样本解码器重构结果；为正样本解码器，为负样本解码器；

步骤4，计算优化目标函数关于模型参数的导数，并进行反向传播更新参数；参数更新的优化算法为随机梯度下降（SGD）算法；

步骤5，重复步骤2、步骤3和步骤4，直到训练收敛；最终得到的y中，如果，对应的那些就是异常数据。

2.根据权利要求1所述的基于竞争重构学习的半监督异常检测方法，其特征在于，步骤1中所述的数据预处理，包括高维数据分辨率较高的图像使用预训练的卷积神经网络模型VggNet或ResNet进行特征提取，提取这些网络的全连接的前一层的特征，并进行数据标准化处理，减均值除标准差。

3. 根据权利要求1所述的基于竞争重构学习的半监督异常检测方法，其特征在于，所述的编码器和解码器，根据不同的数据时空结构选择不同的网络类型：如果数据是属性是一维的，则使用全连接网络；如果数据具有二维空间结构并且属性之间是局部相关的，则选择卷积神经网络；如果数据是时序的，且前后时间节点相关，则选择循环神经网络。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于复旦大学，未经复旦大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811317051.1/1.html，转载请声明来源钻瓜专利网。

上一篇：一种训练模型的方法及装置
下一篇：一种基于迁移学习的甲状腺相关性眼病检测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于竞争重构学习的半监督异常检测方法有效

专利文献下载