[发明专利]一种运用属性选择和平衡约束的谱聚类方法在审
申请号: | 202111057379.6 | 申请日: | 2021-09-09 |
公开(公告)号: | CN113688575A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 朱晓峰;周耀华;罗其敏;文国秋;吴宗谦 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06N20/00;G06F111/04 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 陆梦云 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 运用 属性 选择 平衡 约束 谱聚类 方法 | ||
1.一种运用属性选择和平衡约束的谱聚类方法,其特征在于,包括如下步骤:
1)设立目标函数:将平衡约束、属性约简和局部结构学习集成到一个框架中,设立目标函数,包括:
1-1)确定目标函数的损失项:假设是一个聚类矩阵,其中c是聚类数,关于Y的exclusive lasso即平衡约束项为公式(1)所示:
其中Y是聚类矩阵,yij是矩阵Y的第i行第j列元素,是矩阵Y的转置,是n行1列矩阵,是矩阵1的转置,找到一个使得XW与指示矩阵Y的误差小,根据最小二乘法,损失项表示为由此,样本的维度由原始的d维降低到c维,c<<d,在机器学习中,样本维数是多维的,因此优化目标的损失函数表示为如公式(2)所示:
1-2)将属性约简项加到目标函数中:
对公式(2)引入正则化项,并且对W进行正交约束进行属性选择,目标函数改写为公式(3)所示:
1-3)将平衡约束项加到目标函数中:
正则化参数β>0,叫做调节因子,I为单位矩阵,即对角元素为1,其余元素为0的方阵,WTW=I是对W进行正交约束,在相同数据点不同类中引入竞争因子,目标函数进一步写为如公式(4)所示:
其中,γ为平衡正则项的参数,用公式(1)替换||Y||b,目标函数重写为如公式(5)所示:
1-4)确立最终的目标函数:引入拉普拉斯矩阵的子空间学习进行局部保持投影使得降维前后数据的局部结构不变,最终的目标函数表示为如公式(6)所示:
其中是拉普拉斯图矩阵:L=D-W,其中D是对角矩阵,表示为:是原始数据、是聚类结果、为探索原始数据与聚类结果之间的关系得到的矩阵;
2)对目标函数进行优化,得到聚类结果矩阵Y:
采用迭代优化的方法求目标函数,分别对两个变量进行求解,选择先优化Y,再优化W,首先,目标函数公式(6)经过如公式(7)所示的等价变换:
具体为:
2-1)固定W,优化Y:当W被固定,通过解决如下公式(8)所示的问题求得Y:
首先,对公式(8)的Y进行求导并使导数等于0,得公式(9):
2(L+αIn+γ11T)Y-2αXW=0 (9),
求得Y的值如公式(10):
Y=(L+αIn+γ11T)-1αXW (10);
2-2)固定Y,优化W:根据GPI算法,可以把目标函数中含W的项化为的形式,得公式(11):
整理公式(11),可得公式(12):
此时得GPI算法中的A和B分别为公式(13)、公式(14):
A=αXTX+βD (13),
B=αXTY (14),
2-3)运用属性选择和平衡约束的谱聚类:根据上述优化描述,获得目标函数最终的优化过程如算法1所示:
算法1:运用属性选择和平衡约束的谱聚类算法,
输入:样本矩阵X以及各个可调参数的α,β,γ,输出:Y:
2-3-1)随机初始化W(0)并使得WTW=Ιc;
2-3-2)初始化t=1;
2-3-3).Do{循环开始
2-3-4)通过Y=(L+αIn+γ11T)-1αXW更新Y(t);
2-3-5)更新D(t)斜对角元素的值,该值为
2-3-6)通过A=αXTX+βD更新A(t);
2-3-7)通过B=αXTY更新B(t);
2-3-8)通过GPI算法优化W(t);
2-3-9)更新t=t+1
2-3-10).}循环结束
2-3-11)直到目标函数收敛;
3)采用聚类结果矩阵Y,计算出聚类准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111057379.6/1.html,转载请声明来源钻瓜专利网。