[发明专利]一种基于迁移学习的半监督异常检测方法有效
申请号: | 202110471648.7 | 申请日: | 2021-04-29 |
公开(公告)号: | CN113128613B | 公开(公告)日: | 2023-10-17 |
发明(设计)人: | 唐杰;武港山;冯哲;唐玉婷;薛占奎 | 申请(专利权)人: | 南京大学 |
主分类号: | G06F18/2433 | 分类号: | G06F18/2433;G06N3/0464;G06N3/0895;G06N3/096 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 奚铭 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 监督 异常 检测 方法 | ||
1.一种基于迁移学习的半监督异常检测方法,其特征是构建一个基于卷积神经网络的检测网络进行异常检测,检测网络包括网络和网络两个网络模块和全连接层
首先分别预训练两个网络模块:在异常检测数据集上以最小化输入样本和重构结果的均方误差预训练一个自编码器,包括编码器和解码器两部分,以编码器的参数作为网络的初始化参数;同时,对网络连接一个全连接层在一个与异常检测数据集无关的有标签参考数据集上使用交叉熵为损失函数进行预训练,得到初始化的网络
然后进行联合训练,将网络的浅层参数冻结,连接一个全连接层全连接层的输出与网络的输出拼接后,经过全连接层输出融合特征,构成检测网络;对检测网络在异常检测数据集上进行联合训练,优化检测网络参数,目标是通过优化可学习参数包括网络和网络未冻结的部分以及所有全连接层,最小化在输出特征空间中的一个包含所有正常样本的超球的体积,该超球以一个可学习的点为球心,检测网络将所有正常样本映射到特征空间中的一个超球内,用符号d表示l2度量下输入样本经网络映射后,在特征空间中的映射特征表示和超球中心c的距离,训练采用一个和谐损失函数定义如下:
异常检测数据集包括有标签数据和无标签数据,其中表示无标签数据集合,样本数为n,S={(xn+1,yn+1),…,(xn+m,yn+m)}表示有标签数据集合,样本数为m,y=+1和y=-1分别对应样本x属于正常样本和异常样本的情况;在联合训练中,还对网络和全连接层在参考数据集使用交叉熵为损失函数进行训练,用于对检测网络的训练进行监督;
由训练得到的检测网络进行异常检测,将测试样本输入检测网络,由该输入得到的融合特征表示离超球球心c的l2距离,即为异常分数,分数越高,输入的样本属于异常样本的可能性越大,对异常分数设置阈值,根据阈值判定是否为异常。
2.根据权利要求1所述的一种基于迁移学习的半监督异常检测方法,其特征是所述联合训练具体为:冻结预训练的网络的最后一个卷积层之前的卷积层参数,联合训练包括两部分,一方面,由异常检测数据集抽取样本,对检测网络进行训练,将异常检测数据样本输入到网络和网络中,网络的输出连接全连接层输出特征2,将特征2和网络的输出特征拼接起来,经由全连接层输出最终的融合特征;另一方面从参考数据集中抽取样本作为网络的输入,网络连接全连接层以交叉熵作为损失函数训练,输出特征1用于监督网络的训练;两部分训练交替进行,实现半监督训练;
其中,以和谐损失函数对网络未冻结部分与初始化的网络C和全连接层一起训练进行微调,和谐损失函数关于d的偏导数计算如下:
优化的目标函数定义为:
其中超参数η0,λ0,η为用于平衡和S中样本的权重,最后一项是可学习参数的权重衰减正则化器,其中‖·‖F表示Frobenius范数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110471648.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:考虑三维因素的短舱进气道设计几何参数化方法
- 下一篇:多功能风湿按摩熏蒸装置