[发明专利]一种基于特征同构共享描述的多源异构离群点检测方法有效
申请号: | 201811600061.6 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109993198B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 张磊;王树鹏;吴广君 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 余长江 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于特征同构共享描述的多源异构离群点检测方法,通过在特征同构空间中统一地检测来自异构数据集的离群点,以避免浪费不同来源之间的互补信息,并提高多源离群点的识别率,能够解决在一个一致的特征同构空间中识别所有类型的多源异构离群点的问题。 | ||
搜索关键词: | 一种 基于 特征 同构 共享 描述 多源异构 离群 检测 方法 | ||
【主权项】:
1.一种基于特征同构共享描述的多源异构离群点检测方法,包括以下步骤:对于来源X的数据,为识别其中的离群点,找到其多源异构数据来源Y,其中来源X的正常样本集
和来源Y中的正常样本集![]()
dx和dy分别为来源X和Y的维度;对于来源X中的一个待检测样本
为判断其是否为离群点,将样本c的n1个近邻张成一个仿射空间
对于hi,其是h的第i个成分,如果0≤hi≤1,那么样本c为正常样本;如果hi<0或者hi>1,那么样本c为异常样本,即离群点;通过如下数学模型Ψ1先求取A,B,H,W,再进而求取hi的值,即
其中,
k为特征同构空间的维度,α为平衡参数,
为权重矩阵,
为标签指示矩阵,m为标签数量,
描述了仿射空间中不同点之间近邻关系,
为来源X中的疑似离群样本,n2为疑似离群样本的数量,而![]()
为
在仿射空间中的描述,‖·‖F为F范数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811600061.6/,转载请声明来源钻瓜专利网。