[发明专利]基于图补全和自适应视角权重分配的不完备多视角聚类方法、装置、系统及存储介质在审
申请号: | 201910446754.2 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110135520A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 陈润泽;文杰;徐勇 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 黎健任 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 视角 多视角 低维 存储介质 权重分配 归一化 自适应 构建 表征步骤 聚类类别 传统的 单视角 有效地 迭代 权重 样本 鉴别 捕捉 引入 全局 学习 | ||
1.一种基于图补全和自适应视角权重分配的不完备多视角聚类方法,其特征在于,包括如下步骤:
步骤1,多视角仿射图的构建及补全步骤:归一化各视角中的样本实例,构建并补全各视角的仿射图;
步骤2,学习各视角间一致的低维表征步骤:迭代求取各视角间一致的低维表征;
步骤3,聚类步骤:归一化全局低维表征并使用传统的单视角聚类方法得到聚类类别。
2.根据权利要求1所述的不完备多视角聚类方法,其特征在于,步骤1,多视角仿射图的构建及补全步骤包括:
特征抽取和归一化步骤:提取目标事物的多种特征,并将每种特征视为一个视角:用表示理想情况下提取到的完备的总样本集,用表示第v个视角实际提取到的样例集,其中n和nv分别表示总样本数和第v个视角提取到的样例数,dv表示第v个视角的特征维度,在提取到聚类目标的各个视角特征后,依据式对各视角中的样例进行归一化;
各视角仿射图的构建及填补校正步骤:
首先,在各视角X(v)中利用式构建仿射图W(v);
其次,利用式仿射图拉伸到同样的规模,其中表示第v个视角中的样例与所有样本的对应关系,若第v个视角中的第i个样例表示总样本中第j个样本的视角特征,则为1,否则为0;
最后,对上一步骤得到的各视角拉伸后的仿射图中关于缺失样例的相似信息进行校正:若第v个视角中缺失了总样本序列中第i个样本的样例,则根据式进行该视角中该样例相似信息的校正,其中代表第k个视角仿射图的第i行,H∈Rn×l代表各样本在视角中的存在关系,若总样本集中第i个样本在第k个视角中存在对应的样例,则Hi,k为1,否则为0;然后根据式对称化仿射图。
3.根据权利要求1所述的不完备多视角聚类方法,其特征在于,步骤2,学习各视角间一致的低维表征步骤包括:
变量初始化步骤:对各个视角在指导子空间学习中的权重ω(v)(v=1,...,l)作均等初始化,即ω(v)=1/l(v=1,...,l);通过求解式初始化各视角的低维表征Y(v)(v=1,...,l),其中为第v个视角补全的仿射图的拉普拉斯矩阵;全局低维表征Y*不需初始化,可在迭代第一步根据初始化的Y(v),ω(v)求取;
迭代第一步:首先求解矩阵的特征值和特征向量,然后取最大的c个特征值对应的特征向量构成全局低维表征
迭代第二步:针对第v个视角,首先求解矩阵(λY*Y*T-L(v))的特征值和特征向量,然后取其中最大c个特征值对应的特征向量构成该视角的低维表征
迭代第三步:针对第v个视角,利用式更新视角权重鉴别因子ω(v),其中Υ(v)=Tr(Y(v)TL(v)Y(v))+λ(c-Tr(Y(v)Y(v)TY*Y*T));
判断收敛条件步骤:计算当前第t次迭代目标函数值若迭代次数小于设定值,则进行第(t+1)次迭代,即执行迭代第一步到迭代第三步;若满足收敛条件,则终止迭代,输出一致低维表征Y*;否则不断迭代,直到满足收敛条件,或者迭代次数超过预设最大值,强制终止迭代,输出全局低维表征Y*。
4.根据权利要求1所述的不完备多视角聚类方法,其特征在于,在步骤3,聚类步骤中,低维表征Y*的第i行可视作第i个样本的低维表征,首先归一化每行为单位向量,然后利用传统的单视角聚类方法将n个样本划分为c个簇,从而得到样本聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910446754.2/1.html,转载请声明来源钻瓜专利网。