[发明专利]一种基于张量表示的多视图离群点检测算法在审

申请号：	202011044904.6	申请日：	2020-09-28
公开（公告）号：	CN112116033A	公开（公告）日：	2020-12-22
发明（设计）人：	陈松灿;钟颖宇	申请（专利权）人：	南京航空航天大学
主分类号：	G06K9/68	分类号：	G06K9/68
代理公司：	暂无信息	代理人：	暂无信息
地址：	211106 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于张量表示视图离群检测算法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

张量在表示多视图数据时能够充分捕获数据的多个视图之间可能的关系，同时也能避免视图间的成对比较。据我们所知，基于张量表示的多视图离群点检测方式至今还没有被研究过。现有的多视图离群点检测方法大多采用跨视图成对约束来获得新的特征表示，并根据这些特征来定义离群点评分度量，这没有充分利用视图间的交互信息，并且导致在面对三个或多个视图时较高的复杂度。为了弥补这一不足，本发明提出了一种新的基于张量表示的多视图离群点检测算法。具体而言，首先将多视图数据重塑成张量集形式，然后学习其低秩表示，最后设计了张量表示下的离群值函数来实现检测。

技术领域

本发明属于机器学习领域，具体涉及一种基于张量表示的多视图离群点检测方法，用于解决多视图场景下的离群点检测问题。

背景技术

离群点检测，也被称为异常检测，是一种用于识别数据集中异常样本的数据分析技术。最近的几年里，已发展了大量离群点检测方法。然而，这些离群点检测算法都是针对单视图数据而设计，并不适用于多视图离群点检测场景。

现实中，许多数据通常来自不同的域或不同的特征提取器，相应的每组特征能被视为一个特定视图，由此形成了多视图数据。由于特征提取常受噪声干扰，使得多视图数据中常易出现异常点，进而影响后续任务，因此研究者开始关注如何从多视图数据中检测出离群点。

张量在表示多视图数据时能够充分捕获数据的多个视图之间可能的关系，同时也能避免视图间的成对比较。据我们所知，基于张量表示的多视图离群点检测方法至今还没有被研究过。现有方法大多采用跨视图成对约束来获得新的特征表示，并根据这些特征来定义离群点评分度量，这没有充分利用视图间的交互信息，并且导致在面对三个或多个视图时较高的复杂度。为了弥补这一不足，本发明提出了一种新的基于张量表示的多视图离群点检测算法，以便充分捕获数据的多个视图之间可能的关系，同时也能避免视图间的成对比较

发明内容

本发明针对多视图离群点检测问题，提出了一种基于张量表示的多视图离群点检测方法。

本发明的技术方案是：

一种基于张量表示的多视图离群点检测方法，该方法包括以下步骤：

S1：将原始多视图样本重塑成张量表示形式，从而形成多视图张量集，并将每个张量展开成向量，得到转化后的样本矩阵。

S2：构造样本矩阵的低秩表示学习目标函数，并计算使目标函数值最小的最佳的表示系数和误差矩阵。

S3：根据步骤S2得到的表示系数和误差矩阵，计算所有样本的离群分数，并输出所有样本的离群标签。

进一步地，一种基于张量表示的多视图离群点检测方法，所述的步骤S1具体为：

S101：预先定义M个视图数据的集合D＝{X¹，X²，...，X^M}表示，其中表示第v个视图中的N个样本，其中特征维度为d_v。按归一化每个

S102：对每个多视图样本按照构造相应的多视图张量，从而得到多视图张量集其中X_i表示第i个实例的多视图张量。

S103：把每个多视图张量X展开成向量形式这样，多视图张量集I就转化成样本矩阵

进一步地，一种基于张量表示的多视图离群点检测方法，所述的步骤S2具体为：