[发明专利]一种基于稀疏均值的模糊聚类方法有效
申请号: | 201610629774.X | 申请日: | 2016-08-02 |
公开(公告)号: | CN106295688B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 梅建萍 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州赛科专利代理事务所(普通合伙) 33230 | 代理人: | 郭薇 |
地址: | 310014 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于稀疏均值的模糊聚类方法,将待聚类的文档用向量空间模型表示为高维稀疏向量,设置参数,初始化均值,基于当前均值更新所有隶属度的值,更新权重,然后基于隶属度更新对应的均值,当对应的均值不再变化或迭代次数最大时迭代结束,输出聚类结果,否则重复。本发明通过稀疏均值使得均值也就是类中心点和样本点一样具有局域稀疏特性,增加基于样本点和均值欧氏距离来描述样本点和类相似性的有效性,在时间上更加高效,产生具有稀疏特性的均值使得类中心点更加自然地代表稀疏样本点的特性,同时为了增加对均值的稀疏性的控制,还在目标函数中加入均值范数的正则项以得到新的最小化目标函数,使得可以更加快速的求解。 | ||
搜索关键词: | 一种 基于 稀疏 均值 模糊 方法 | ||
【主权项】:
1.一种基于稀疏均值的模糊聚类方法,其特征在于:所述方法包括以下步骤:步骤1.1:将待聚类的文档用向量空间模型表示为高维稀疏向量X={x1,x2,…xn},其中每个样本点为s维向量,即xi∈Rs,s>0,1≤i≤n;n为样本总数,n>0;步骤1.2:设置参数,所述参数包括类数k、模糊化系数m、初始正则项权重β0、结束判断参数ε及最大迭代次数T;0<k<n,1<m<2;β0>0;设定带有均值l1范数正则项的最小化目标函数
其中,uci表示第i个样本到第c个类的隶属度,δc表示第c个类的均值;步骤1.3:初始化均值,得到与最后结果相近的k个初始均值分别为[δ1,δ2,…δk];计迭代次数l=1;步骤1.4:基于当前均值,利用式
更新所有隶属度的值,1≤c≤k;步骤1.5:对每一类c=1,2,…,k,更新权重β,然后基于步骤1.4的隶属度uci,采用式
更新对应的k个均值,其中,
sign(δ′c)返回该向量中对应元素的符号;步骤1.6:当对应的k个均值不再变化或迭代次数l>T,迭代结束;否则重复步骤1.3;步骤1.7:输出聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610629774.X/,转载请声明来源钻瓜专利网。