[发明专利]进行网络资源聚类的方法及装置在审
申请号: | 201310642355.6 | 申请日: | 2013-12-03 |
公开(公告)号: | CN103678545A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 白明 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 姜精斌 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 进行 网络资源 方法 装置 | ||
1.一种进行网络资源聚类的方法,其特征在于,所述方法包括:
根据设置的总的聚类数量,及对网络资源进行聚类处理的层数,确定每层对应的子聚类数量,其中所述层数大于等于2;
针对每层中每组待聚类的网络资源,分别并行进行下述步骤:
针对每组待聚类的网络资源,根据该层对应的子聚类数量,在该组中初始化得到相应数量的中心点;
根据该组中的每个中心点及该组中待聚类的网络资源,采用K-Means算法进行聚类处理;并
当确定当前为最后一层聚类处理时,输出网络资源的聚类结果,否则,将当前聚类后的每组网络资源作为下一层聚类处理的每组待聚类的网络资源,进行下一层的聚类处理。
2.如权利要求1所述的方法,其特征在于,所述方法在对网络资源进行第一层的聚类处理之前,所述方法还包括:
判断待聚类的网络资源的维度是否不大于设定的维度阈值;
当待聚类的网络资源的维度大于设定的维度阈值时,按照设置的降低维度的方法对待聚类的网络资源进行降维处理。
3.如权利要求2所述的方法,其特征在于,当对待聚类的网络资源进行降维处理后,所述输出网络资源的聚类结果之前,所述方法还包括:
针对每组聚类后的网络资源,根据每个网络资源降低的维度,对该网络资源进行升高维度的处理。
4.如权利要求2所述的方法,其特征在于,所述按照设置的降低维度的方法对待聚类的网络资源进行降维处理包括:
在所述待聚类的网络资源中进行数据采样,根据采样后的数据及设置的降低维度的方法,确定降维模型;
根据降维模型及待聚类的网络资源,对待聚类的网络资源进行降维处理。
5.如权利要求1所述的方法,其特征在于,所述网络资源包括:
图片资源、文字资源和音频资源。
6.如权利要求1所述的方法,其特征在于,所述在该组中初始化得到相应数量的中心点包括:
判断当前进行的是否为第一层聚类处理;
若当前进行的是第一层聚类处理,将总的网络资源作为第一层进行聚类处理的一组待聚类的网络资源,根据该第一层对应的子聚类数量,在该组待聚类的网络资源中初始化得到相应数量的中心点;
否则,该每组待聚类的网络资源为上一层聚类后得到的每组网络资源,根据该层对应的子聚类数量,在每组待聚类的网络资源中初始化,得到相应数量的中心点。
7.一种进行网络资源聚类的装置,其特征在于,所述装置包括:
确定模块,用于根据设置的总的聚类数量,及对网络资源进行聚类处理的层数,确定每层对应的子聚类数量,其中所述层数大于等于2;
聚类模块,用于针对每层中每组待聚类的网络资源,分别并行进行下述步骤:针对每组待聚类的网络资源,根据该层对应的子聚类数量,在该组中初始化得到相应数量的中心点;根据该组中的每个中心点及该组中待聚类的网络资源,采用K-Means算法进行聚类处理;
判断模块,用于判断聚类模块当前进行的是否为最后一层聚类处理;
输出返回模块,用于当判断模块确定当前为最后一层聚类处理时,输出网络资源的聚类结果,否则,将当前聚类后的每组网络资源作为下一层聚类处理的每组待聚类的网络资源,返回聚类模块继续处理。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
降维模块,用于判断待聚类的网络资源的维度是否不大于设定的维度阈值;当待聚类的网络资源的维度大于设定的维度阈值时,按照设置的降低维度的方法对待聚类的网络资源进行降维处理。
9.如权利要求8所述的装置,其特征在于,所述输出返回模块,还用于当降维模块对待聚类的网络资源进行降维处理后,针对每组聚类后的网络资源,根据每个网络资源降低的维度,对该网络资源进行升高维度的处理。
10.如权利要求8所述的装置,其特征在于,所述降维模块,具体用于在所述待聚类的网络资源中进行数据采样,根据采样后的数据及设置的降低维度的方法,确定降维模型;根据降维模型及待聚类的网络资源,对待聚类的网络资源进行降维处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310642355.6/1.html,转载请声明来源钻瓜专利网。