[发明专利]一种基于特征同构共享描述的多源异构离群点检测方法有效
申请号: | 201811600061.6 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109993198B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 张磊;王树鹏;吴广君 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 余长江 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 同构 共享 描述 多源异构 离群 检测 方法 | ||
1.一种基于特征同构共享描述的多源异构离群点检测方法,包括以下步骤:
对于来源X的数据,为识别其中的离群点,找到其多源异构数据来源Y,其中来源X为语音源,其正常样本集来源Y为相对应的图片源,其正常样本集dx和dy分别为来源X和Y的维度;
对于来源X中的一个待检测样本为判断其是否为离群点,将样本c的n1个近邻张成一个仿射空间
对于hi,其是h的第i个成分,如果0≤hi≤1,那么样本c为正常样本;如果hi0或者hi1,那么样本c为异常样本,即离群点;
通过如下数学模型Ψ1先求取A,B,H,W,再进而求取hi的值,即
其中,k为特征同构空间的维度,α为平衡参数,为权重矩阵,为标签指示矩阵,m为标签数量,描述了仿射空间中不同点之间近邻关系,为来源X中的疑似离群样本,n2为疑似离群样本的数量,而为在仿射空间中的描述,‖·‖F为F范数。
2.如权利要求1所述的方法,其特征在于,利用Lagrangian对偶法,通过利用凸包约束的加权和来增广Ψ1的目标函数进而获得如下可解的模型Ψ2:
s.t.ATA≥0 and BTB≥0
通过循环迭代过程实现模型Ψ2的逐步优化,以求得最优解。
3.如权利要求2所述的方法,其特征在于,将Ψ2简化为如下公式:
其中,F(·)为平滑目标函数,Z=[AZ BZ HZWZ]代表优化变量,为针对每一个变量的封闭域:
4.如权利要求3所述的方法,其特征在于,通过结合APG算法和交替优化方法,以求解所述简化公式。
5.如权利要求4所述的方法,其特征在于,APG算法将构造一个解点序列{Zi}和一个搜索点序列{Si},其中每个Zi都是从Si中更新,APG算法中的给定点需要投影到集合中,给定点为S=[AS BS HS WS],在封闭集上的投影Z=[AZ BZ HZ WZ]定义为:
结合APG和PSP算法求解上述公式,以得到A,B,H,S。
6.如权利要求5所述的方法,其特征在于,采用多源异构离群点检测方法来结合APG和PSP算法,来求解上述公式,步骤包括:
设定令
固定B,H,W,求解A,具体包括:
定义其中,为平滑函数F(·)的梯度,设置aj=(s-1)/s,其中j=1,2,…,h1,s初始值为1;
计算和其中i=1,2,…;
循环计算和如果则结束,否则更新ηi=ηi×2;
循环计算结束后更新
令ηi+1=ηi进行下一轮计算,直到解出A;
求解B,H,W与上述求解A同理。
7.一种基于特征同构共享描述的多源异构离群点检测系统,包括存储器和处理器,所述存储器存储计算机程序,所述程序被配置为由所述处理器执行,所述程序包括用于执行上述权利要求1至6任一所述方法中各步骤的指令。
8.一种存储计算机程序的计算机可读存储介质,所述计算机程序包括指令,所述指令当由服务器的处理器执行时使得所述服务器执行上述权利要求1至6任一所述方法中的各个步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811600061.6/1.html,转载请声明来源钻瓜专利网。