[发明专利]一种社交网络关键节点发现方法及系统有效
申请号: | 202011628252.0 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112765329B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 王建民;沈恩亚;太志伟;宋怡然 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/36;G06F16/9536 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 郭亮 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 关键 节点 发现 方法 系统 | ||
本发明提供一种社交网络关键节点发现方法及系统,该方法包括:对社交网络中目标图数据的节点进行聚类,并通过有偏随机游走,根据聚类后的节点,获取对应的有偏随机游走路径;将同一聚类的有偏随机游走路径进行组合,得到多个有偏随机游走路径文档,并根据多个有偏随机游走路径文档,构建得到有偏随机游走路径语料库;对所述有偏随机游走路径语料库进行关键词提取,获取每个有偏随机游走路径文档中的关键词,以根据所述关键词得到所述目标图数据的关键节点。本发明可更加全面的获知节点对聚类的重要程度;同时,在得到的结果中,不同的节点不会出现相同的重要程度值,具有良好的区分度,且适用于非连通图。
技术领域
本发明涉及计算机网络分析技术领域,尤其涉及一种社交网络关键节点发现方法系系统。
背景技术
节点中心性的概念,最初来自于社交网络的研究中,指的是在一个社交网络中节点的重要程度,后来逐渐扩展到生物蛋白网络等其余图数据,成为描述各种图数据中节点重要程度的方法。
判断节点重要程度最直接的思路为查询该节点与其余节点的链接,Degreecentrality(度中心性)通过对每个节点的出入度(根据图数据的实际含义和不同研究需要选择出度、入度或两者之和)进行统计,判断节点的重要性。这个方法直观易懂,计算效率高,适用范围广,但也存在一个较大的局限性:Degree centrality只能反映每个节点附近静态的局部链接关系。其余现有方法对于判断图中能够代表各部分的关键节点这一任务,也存在着一系列局限性,具体表现为:1、大多考虑节点对全图的重要程度,在一定程度上与提取图各部分的关键节点这一任务相违背;2、基于最短路径的一系列节点中心性计算方法(如betweenness centrality、closeness centrality、harmonic centrality等),不适用于非连通图;3、简单地统计图的拓扑信息的一系列方法,得到的节点中心性数值缺乏区分度,容易出现多个节点重要程度相同的情况。
因此,现在亟需一种社交网络关键节点发现方法及系统来解决上述问题。
发明内容
针对现有技术存在的问题,本发明提供一种社交网络关键节点发现方法及系统。
本发明提供一种社交网络关键节点发现方法,包括:
对社交网络中目标图数据的节点进行聚类,并通过有偏随机游走,根据聚类后的节点,获取对应的有偏随机游走路径;
将同一聚类的有偏随机游走路径进行组合,得到多个有偏随机游走路径文档,并根据多个有偏随机游走路径文档,构建得到有偏随机游走路径语料库;
对所述有偏随机游走路径语料库进行关键词提取,获取每个有偏随机游走路径文档中的关键词,以根据所述关键词得到所述目标图数据的关键节点。
根据本发明提供的一种社交网络关键节点发现方法,所述通过有偏随机游走,根据聚类后的节点,获取对应的有偏随机游走路径,包括:
通过有偏随机游走路,将每个聚类中各个节点作为起始点进行随机游走,得到对应的有偏随机游走路径。
根据本发明提供的一种社交网络关键节点发现方法,所述对所述有偏随机游走路径语料库进行关键词提取,获取每个有偏随机游走路径文档中的关键词,以根据所述关键词得到所述目标图数据的关键节点,包括:
将所述目标图数据中的节点作为所述有偏随机游走路径语料库中的词,获取所述目标图数据中的节点在所述有偏随机游走路径语料库的逆文档频率;
根据所述目标图数据中的节点所属聚类,获取节点在对应的有偏随机游走路径文档的词频;
根据所述逆文档频率和所述词频,获取所述目标图数据的每种聚类中各个节点的节点重要程度,并根据所述节点重要程度,将每种聚类中的节点进行排序,以根据排序结果得到所述目标图数据的关键节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011628252.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种增程式简约家用云梯
- 下一篇:场景模型部署方法、装置、设备及存储介质