[发明专利]一种基于通信网络数据分析的关键人物挖掘方法及系统有效
申请号: | 201710149470.8 | 申请日: | 2017-03-14 |
公开(公告)号: | CN107092651B | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 姜松浩;宋永浩;习健;刘诗敏;李卓坚;金岩;赵晓芳 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通信 网络 数据 分析 关键人物 挖掘 方法 系统 | ||
本发明提出一种基于通信网络数据分析的关键人物挖掘方法及系统,该方法包括步骤1,获取通信记录并进行预处理,根据预处理后的通信记录构建有向加权通信网络,根据所述有向加权通信网络构建有权邻接矩阵,并计算权威值与枢纽值;步骤2,根据所述权威值,及所述有向加权通信网络中两节点链接边的权重,计算新权威值与新枢纽值;步骤3,设置异常特征参数α,并根据所述新权威值与所述新枢纽值,计算最终权威值,对所述最终权威值进行最大‑最小规范化,获得关键人物。本发明能够快速有效的获取通信网络中关键人物的信息,缩短关键人物发现时间,减少工作量。
技术领域
本发明涉及通信网络的数据分析领域,特别涉及一种基于通信网络数据分析的关键人物挖掘方法及系统。
背景技术
手机在我们当今社会生活中无疑是一种必不可少的日常通讯工具,使用手机这种日常通讯工具在进行通话或短信等通信行为活动中,会产生一系列的详细通信单数据,根据这种通信单,可以构建出全面详细的电话通信网络。
随着各行业业务数据量的井喷式增长,数据挖掘这门学科受到学术界和工业界的广泛关注。数据挖掘,一般是指在海量数据基础上,基于计算科学、统计学、机器学习、信息检索、数据仓库、模式识别等相关领域技术以及结合业务领域专家知识构建高效可用的数据挖掘模型,从已知数据中挖掘未知且极具价值的知识信息,适用于多种领域。
通信网络数据分析,是根据电话通信单构建出一种基于通信的社交网络基础上,使用或利用计算科学、统计学、社会心理学等多学科的融合理论和方法,为理解人类各种社交关系的形成、行为特点分析以及信息传播的规律等提供的分析方法,现有在社交网络拓扑中分析网络节点重要程度的主要技术有:
现有技术一:Hits算法,该算法出自于Kleinberg,Jon(1999).Authoritativesources in a hyperlinked environment.Journal of the ACM.46(5):604–632.doi:10.1145/324133.324140.最早应用在信息检索领域,用于分析网页的重要程度,该算法是Web结构挖掘中最具权威性和使用最广泛的算法。Hits算法利用Web的链接结构进行挖掘,其核心思想是建立在页面链接关系的基础上,对链接结构的进行改进。Hits算法通过两个评价权值——权威值(Authority)和枢纽值(Hub)来对网页质量进行评估,其基本思想是利用页面之间的引用链接来挖掘隐含在其中的有用信息(如权威性),具有计算简单且效率高的特点,HITS算法认为对每一个网页应该将其内容权威值(Authority)和枢纽值(Hub)分开来考虑,在对网页内容权威值(Authority)做出评价的基础上再对页面的枢纽值(Hub)进行评价,然后给出该页面的综合评价。权威值(Authority)与网页自身直接提供内容信息的质量相关,被越多网页所引用的网页,其权威值(Authority)越高;枢纽值(Hub)与网页提供的超链接页面的质量相关,引用越多高质量页面的网页,其枢纽值(Hub)越高。该算法用于社交网络拓扑中可以分别考虑权威值(Authority)和枢纽值(Hub)来计算该网络中的网络节点的重要性。
现有技术二:PageRank是Google提出的专有的算法,用于衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度。同样最早用于信息检索领域,计算页面的“得票数”,一个页面的“得票数”由所有链向它的页面的重要性来决定,到一个页面的链接相当于对该页投一票。一个页面的PageRank是由所有链向它的页面(“链入页面”)的重要性经过递归算法得到的。一个有较多链入页面的网页会有较高的等级,相反如果一个页面没有任何链入页面,那么它没有等级。该算法用于社交网络拓扑中时往往不考虑网络连接的有向性,单纯考虑网络中用户连接数去计算该网络中的网络节点的重要性。
社会生活中存在着各种各样需要对人物重要程度进行评价、以及关键人物发现等的应用场景。例如警察针对犯罪侦查过程中,,疑犯的锁定和排除是警察破案的关键。传统方法针对具有异常通信特征的关键人物发现中往往综合社会行为学、心理学、现代刑侦技术手段等。现有针对异常通信特征的关键人物发现技术主要有:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710149470.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置