[发明专利]一种网络空间安全领域特定用户群体挖掘方法在审

专利信息
申请号: 201910717964.0 申请日: 2019-08-05
公开(公告)号: CN112328866A 公开(公告)日: 2021-02-05
发明(设计)人: 方勇;刘亮;张磊;黄建军 申请(专利权)人: 四川大学
主分类号: G06F16/9535 分类号: G06F16/9535
代理公司: 暂无信息 代理人: 暂无信息
地址: 610065 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 网络 空间 安全 领域 特定 用户 群体 挖掘 方法
【说明书】:

发明公开了一种网络空间安全领域特定用户群体挖掘方法,用于从海量的社交网络用户中挖掘出网络空间安全领域用户群体。该方法包括下列步骤:选择网络空间安全领域用户作为种子用户;构建特定用户间相似性度量方法,并通过相似度计算从种子用户的关系网络中发现该用户的相似用户群体;采集用户信息并进行标注,抽取用户特征,并通过这些标注过的用户特征集合训练分类模型得到网络空间安全领域用户判别模型;通过用户判别模型对相似用户群体进行判别得到网络空间安全领域用户群体。该方法可以有效地从海量的社交网络用户中挖掘出目标领域用户群体。

技术领域

本发明设计一种网络空间安全领域特定用户群体挖掘方法,通过该方法从海量的社交网络用户中挖掘网络空间安全领域特定用户群体。

背景技术

随着互联网的发展,在线社交网络在人们日常生活中的使用越来越频繁,成为了各种数据挖掘和分析工作的数据来源。其中有许多网络空间安全领域的用户在各大社交网络上持续地、实时地发布和分享安全领域的资讯、知识等信息。这些用户是很好的威胁情报来源,也是安全领域研究工作的优秀数据来源。因此如何在海量的社交网络用户中挖掘出目标领域用户群体是值得重点关注的研究点。

本发明针对上述问题,构建了一种网络空间安全领域用户群体挖掘方法,该方法从给定的种子用户出发,通过相似用户发现和用户检测最终可以有效地挖掘出网络空间安全领域用户群体,解决了海量用户造成的数据过载问题。

发明内容

本发明是一种网络空间安全领域特定用户群体挖掘方法,用于从海量的社交网络用户中挖掘出网络空间安全领域用户群体。该方法从选择的种子用户出发通过相似用户发现和用户判别得到网络空间安全领域用户群体。

本发明的内容包括以下方面:

(1)构建相似用户发现模型,通过特定用户的关系网络发现其相似用户群体,主要包括如下步骤:给定一个用户u,采集用户的关注用户集、粉丝用户集以及与用户有交互行为的访客用户集,将这三类用户合并记为候选用户集;通过用户的关注、粉丝、交互关系构建用户相似度计算方法;通过计算用户u与候选用户集中用户的相似度并按照相似度大小排序选择Top N个用户作为用户u的相似用户集。

(2)构建网络空间安全领域用户判别模型,其主要步骤如下:采集用户信息并将其标注为网络空间安全领域用户和普通用户;从用户基本信息、用户行为、用户文本内容三个方面提取用户特征;选择多种分类算法利用标注好的样本数据进行训练,通过准确率、召回率和F1评估各种分类算法所构建的用户判别模型的性能;以随机森林和选择的特征组合构建网络空间安全领域用户判别模型。

(3)选择已知的网络空间安全领域用户作为种子用户,根据权利要求1所述的步骤一进行相似用户发现得到种子用户的相似用户集;使用权利要求1所述的步骤二构建的用户判别模型对相似用户集中的用户进行判别得到网络空间安全领域用户。

本发明可以解决海量用户造成的数据过载问题,有效地从海量用户中挖掘出网络空间安全领域特定用户群体。

附图说明

图1是本发明所述的网络空间安全领域特定用户群体挖掘方法的框架图

具体实施方式

本发明的具体实施方式是:

(1)选择已知的网络空间安全领域用户作为种子用户,从种子用户SeedUser出发,获取如下信息:获取用户的关注用户集、粉丝用户集;获取SeedUser所发布的推文数据;从用户的推文中提取与用户有评论、转发、@等交互行为的访客集。将这三类用户合并记为候选用户集。获取EN中的每个用户ui的推文、社交关系数据。

(2)计算用户SeedUser与ui的相似度。本发明基于用户的关注、粉丝和交互关系构建用户间的相似性度量,具体的相似度计算方法如下所示:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910717964.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top