[发明专利]进行网络资源聚类的方法及装置在审
申请号: | 201310642355.6 | 申请日: | 2013-12-03 |
公开(公告)号: | CN103678545A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 白明 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 姜精斌 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种进行网络资源聚类的方法及装置,解决现有网络资源聚类时无法同时保证效率和准确度的问题。该方法根据总的聚类数量,设置对网络资源进行聚类处理的层数,确定每层对应的子聚类数量,对每层对待聚类的网络资源处理时,并行的分别对每组待聚类的网络资源进行处理。本发明实施例中将聚类处理的过程分层处理,在对网络资源进行聚类处理时,每一层针对上一层聚类后的每组网络资源分别进行聚类处理,提高采用K-Means算法对网络资源聚类处理的效率,并且在每层都遍历待聚类的网络资源,并且在每层采用K-Means算法,根据设置的迭代次数或距离阈值收敛条件进行聚类处理,在提高聚类效率的同时也能保证聚类结果的精确性。 | ||
搜索关键词: | 进行 网络资源 方法 装置 | ||
【主权项】:
一种进行网络资源聚类的方法,其特征在于,所述方法包括:根据设置的总的聚类数量,及对网络资源进行聚类处理的层数,确定每层对应的子聚类数量,其中所述层数大于等于2;针对每层中每组待聚类的网络资源,分别并行进行下述步骤:针对每组待聚类的网络资源,根据该层对应的子聚类数量,在该组中初始化得到相应数量的中心点;根据该组中的每个中心点及该组中待聚类的网络资源,采用K‑Means算法进行聚类处理;并当确定当前为最后一层聚类处理时,输出网络资源的聚类结果,否则,将当前聚类后的每组网络资源作为下一层聚类处理的每组待聚类的网络资源,进行下一层的聚类处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310642355.6/,转载请声明来源钻瓜专利网。