[发明专利]一种基于特定用户的群体关系挖掘与分析方法有效
申请号: | 201911039609.9 | 申请日: | 2019-10-29 |
公开(公告)号: | CN110909253B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 曹金璇;杜彦辉;芦天亮;陈志扬 | 申请(专利权)人: | 中国人民公安大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 李建华 |
地址: | 100038 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特定 用户 群体 关系 挖掘 分析 方法 | ||
本发明提出了一种基于特定用户的群体关系挖掘与分析方法,包括如下步骤:选取一定数量的具有相同特征或共同行为的用户作为特定用户;利用改进的最短路径图聚类算法去挖掘关联所述特定用户之间的关系,形成初级群体;对节点进行属性特征分析,将所述初级群体中的所述用户节点属性特征标签构造成初级群体属性比对集合;获得候选扩展用户及其属性集合,计算所述候选扩展用户的属性与所述初级群体比对集合属性间的相似度,选取相似度大于阈值的候选扩展用户加入到所述初级群体中。本发明结合群体关系结构的内聚性以及个体在特定属性子集的相似性的来挖掘群体,聚类效果良好。
技术领域
本发明涉及社交网络领域,尤其涉及在社交网络中对群体关系进行挖掘与分析的方法。
背景技术
长期以来,社交网络群体发现就是把群体作为检索目标,利用群体在关系结构或者个体属性上的可挖掘特征作为发现基础,对具有特定组织结构或属性特征的用户子集进行挖掘的过程。现有技术中社交网络群体发现方法通常有两类,分别是基于群体结构的图聚类算法和基于个体属性特征的聚类算法。
对于基于群体结构的图聚类算法,是社交网络中的群体挖掘通常采用的方法,其利用群体之间的结构关系,对群体进行聚类分析。图聚类算法也常被用在社交网络分析中,它用节点表示网络中的用户,节点之间的联系表示用户之间的交互关系,最终形成复杂的网络图。图聚类算法是聚类分析算法中的一种类型。对于不同规模的数据集、不同数据集可视化方式、不同数据集的应用场景,分别使用不同的图聚类算法。根据不同的方式,可以将图聚类算法分为基于随机流的算法、基于划分的算法、基于谱聚类的算法和基于层次的算法。马尔可夫聚类算法(MCL)是一种快速且可扩展的图聚类算法,该算法基于模拟随机流,不需要预先设定聚类数目,随机流的下一步只和当前所处节点有关。基于划分的算法中,K-means算法和K-medoids算法最常用,最短路径Dijkstra算法通常在计算关联度时使用。PF算法、SM算法、KVV算法都是经典的谱聚类的算法,该类算法可以通过反复使用两路划分的方法来解决聚类中多类的问题。基于层次的聚类算法分可以为凝聚层次算法和分裂层次算法,它的原理是对数据进行分层分析,把数据看成树结构图,无论采用向上或向下的组成方式,最终形成一个个子图。
对于基于个体属性特征的聚类算法,是由于社交网络中群体的用户属性包含基础资料、角色、兴趣等信息,相同群体内的用户则具有相似的信息。因此,可以说群体具有个体属性相似的特征。对个体属性进行相似度计算就是计算用户之间的相似情况,依据所计算相似度来构建网络关系拓扑结构,将大型社交网络划分成多个小型的具有相关性的群体。基于个体属性特征的聚类算法包括基于属性相似度的算法和基于网格的算法。基于属性相似度的算法对用户属性特征进行相似度计算,根据相似度把个体划分到聚类群体中心,然后基于新的中心重新分配,如此迭代直到收敛。基于网格的算法采用网格单元结构,将属性空间进行划分,然后对划分好的密集的网格单元进行聚类。STING算法、WaveCluster算法都是基于网格的聚类算法。
为了能够挖掘社交网络中关系紧密连接、属性特征上具有相似性的群体,本申请提出了一种结合群体关系结构的内聚性以及个体在特定属性子集的相似性的社交网络中目标群体挖掘与分析方法。
发明内容
本发明将社交网络六度分隔理论作为理论基础,提出了一种基于特定用户的群体关系挖掘与分析方法。具体的:
一种社交网络中对群体关系进行挖掘与分析的方法,所述社交网络中的用户使用节点进行表示,所述方法包括如下步骤:
1)特定用户选取:选取一定数量的具有相同特征或共同行为的用户作为特定用户;
2)关联特定用户:利用改进的最短路径图聚类算法去挖掘关联所述第1)步中所选取出的所述特定用户之间的关系,对所述特定用户进行关系关联,并形成初级群体;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民公安大学,未经中国人民公安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911039609.9/2.html,转载请声明来源钻瓜专利网。