[发明专利]一种基于稀疏均值的模糊聚类方法有效

专利信息
申请号: 201610629774.X 申请日: 2016-08-02
公开(公告)号: CN106295688B 公开(公告)日: 2019-10-18
发明(设计)人: 梅建萍 申请(专利权)人: 浙江工业大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 杭州赛科专利代理事务所(普通合伙) 33230 代理人: 郭薇
地址: 310014 *** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于稀疏均值的模糊聚类方法,将待聚类的文档用向量空间模型表示为高维稀疏向量,设置参数,初始化均值,基于当前均值更新所有隶属度的值,更新权重,然后基于隶属度更新对应的均值,当对应的均值不再变化或迭代次数最大时迭代结束,输出聚类结果,否则重复。本发明通过稀疏均值使得均值也就是类中心点和样本点一样具有局域稀疏特性,增加基于样本点和均值欧氏距离来描述样本点和类相似性的有效性,在时间上更加高效,产生具有稀疏特性的均值使得类中心点更加自然地代表稀疏样本点的特性,同时为了增加对均值的稀疏性的控制,还在目标函数中加入均值范数的正则项以得到新的最小化目标函数,使得可以更加快速的求解。
搜索关键词: 一种 基于 稀疏 均值 模糊 方法
【主权项】:
1.一种基于稀疏均值的模糊聚类方法,其特征在于:所述方法包括以下步骤:步骤1.1:将待聚类的文档用向量空间模型表示为高维稀疏向量X={x1,x2,…xn},其中每个样本点为s维向量,即xi∈Rs,s>0,1≤i≤n;n为样本总数,n>0;步骤1.2:设置参数,所述参数包括类数k、模糊化系数m、初始正则项权重β0、结束判断参数ε及最大迭代次数T;0<k<n,1<m<2;β0>0;设定带有均值l1范数正则项的最小化目标函数其中,uci表示第i个样本到第c个类的隶属度,δc表示第c个类的均值;步骤1.3:初始化均值,得到与最后结果相近的k个初始均值分别为[δ12,…δk];计迭代次数l=1;步骤1.4:基于当前均值,利用式更新所有隶属度的值,1≤c≤k;步骤1.5:对每一类c=1,2,…,k,更新权重β,然后基于步骤1.4的隶属度uci,采用式更新对应的k个均值,其中,sign(δ′c)返回该向量中对应元素的符号;步骤1.6:当对应的k个均值不再变化或迭代次数l>T,迭代结束;否则重复步骤1.3;步骤1.7:输出聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610629774.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top