[发明专利]基于节点属性标签传播的网页聚类方法有效
申请号: | 201210176912.5 | 申请日: | 2012-05-31 |
公开(公告)号: | CN102768670A | 公开(公告)日: | 2012-11-07 |
发明(设计)人: | 张乐君;夏磊;张健沛;杨静;国林 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 节点 属性 标签 传播 网页 方法 | ||
1.一种基于节点属性标签传播的网页聚类方法,其特征是:
(1)依据网页的链接关系构造拓扑结构图模型;
(2)为图模型中每个节点构建属性特征向量;
(3)初始化网络中的节点标签;
(4)依据拓扑结构及节点属性迭代更新节点的标签;
(5)定义停止更新节点标签的条件。
2.根据权利要求1所述的基于节点属性标签传播的网页聚类方法,其特征是所述的依据网页的链接关系构造拓扑结构图模型的方法是:
1)将互联网中的网页映射为图模型中的节点;
2)将网页中的链接关系映射为图模型中节点之间相互连接的边。
3.根据权利要求1或2所述的基于节点属性标签传播的网页聚类方法,其特征是所述的为图模型中每个节点构建属性特征向量的方法是:
1)提取每个网页能够表现其特征的关键词;
2)对所有的关键词进行汇总整理并以此构建一个属性集合,其中的元素按拼音字母先后顺序排序;
3)依次为图模型中每个网页节点标记其属性向量,向量的维数与集合的规模相等。
4.根据权利要求1或2所述的基于节点属性标签传播的网页聚类方法,其特征是所述的初始化网络中的节点标签的方法是:依次为图中每个节点分配一个唯一的数字标签,以表示它所属的簇结构。
5.根据权利要求3所述的基于节点属性标签传播的网页聚类方法,其特征是所述的初始化网络中的节点标签的方法是:依次为图中每个节点分配一个唯一的数字标签,以表示它所属的簇结构。
6.根据权利要求1或2所述的基于节点属性标签传播的网页聚类方法,其特征是所述的依据拓扑结构及节点属性迭代更新节点的标签的方法是:当算法未满足终止条件时,反复迭代执行以下步骤,
1)以随机顺序排列网络中的节点;
2)按照随机排列的顺序,依次依据其邻节点中出现次数最多的标签异步更新当前节点的标签;
3)若最高频率的标签不唯一,依次计算每个最高频率标签对应的节点集中所包含元素的属性平均值;
4)计算当前待更新节点与各个节点集属性均值的相似度,选择相似度最大的节点集对应的标签更新当前节点。
7.根据权利要求3所述的基于节点属性标签传播的网页聚类方法,其特征是所述的依据拓扑结构及节点属性迭代更新节点的标签的方法是:当算法未满足终止条件时,反复迭代执行以下步骤,
1)以随机顺序排列网络中的节点;
2)按照随机排列的顺序,依次依据其邻节点中出现次数最多的标签异步更新当前节点的标签;
3)若最高频率的标签不唯一,依次计算每个最高频率标签对应的节点集中所包含元素的属性平均值;
4)计算当前待更新节点与各个节点集属性均值的相似度,选择相似度最大的节点集对应的标签更新当前节点。
8.根据权利要求4所述的基于节点属性标签传播的网页聚类方法,其特征是所述的依据拓扑结构及节点属性迭代更新节点的标签的方法是:当算法未满足终止条件时,反复迭代执行以下步骤,
1)以随机顺序排列网络中的节点;
2)按照随机排列的顺序,依次依据其邻节点中出现次数最多的标签异步更新当前节点的标签;
3)若最高频率的标签不唯一,依次计算每个最高频率标签对应的节点集中所包含元素的属性平均值;
4)计算当前待更新节点与各个节点集属性均值的相似度,选择相似度最大的节点集对应的标签更新当前节点。
9.根据权利要求5所述的基于节点属性标签传播的网页聚类方法,其特征是所述的依据拓扑结构及节点属性迭代更新节点的标签的方法是:当算法未满足终止条件时,反复迭代执行以下步骤,
1)以随机顺序排列网络中的节点;
2)按照随机排列的顺序,依次依据其邻节点中出现次数最多的标签异步更新当前节点的标签;
3)若最高频率的标签不唯一,依次计算每个最高频率标签对应的节点集中所包含元素的属性平均值;
4)计算当前待更新节点与各个节点集属性均值的相似度,选择相似度最大的节点集对应的标签更新当前节点。
10.根据权利要求6所述的基于节点属性标签传播的网页聚类方法,其特征是所述的定义停止更新节点标签的条件的方法是:判断图中的所有节点的标签是否都是它们的邻节点中出现次数最多的标签,如果每个节点都与其大多数邻接点标签一致,则终止,网络显示出簇结构的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210176912.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种搪瓷钢氧化锡薄膜发热管
- 下一篇:擦除译码方法、装置和接收机