[发明专利]一种社交网用户异常行为的分析方法在审

专利信息
申请号: 201410101728.3 申请日: 2014-03-19
公开(公告)号: CN103853841A 公开(公告)日: 2014-06-11
发明(设计)人: 闫丹凤;吴海莉;徐佳 申请(专利权)人: 北京邮电大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 社交 用户 异常 行为 分析 方法
【说明书】:

技术领域

发明涉及一种社交网用户异常行为的分析方法,用于检测社交网站中发布恶意链接、垃圾广告、诈骗消息等的用户异常行为,属于网络安全检测技术领域。

背景技术

CNNIC统计数据显示,2013年我国微博用户数量达到5.36亿,此外,使用人人网的用户数量也达到了2.8亿之多。由于社交网络中不可或缺的重要实体(即海量用户)的存在,促使着商务类和个人类社交不断发展,而伴随着网络社交的蓬勃发展,各种信息资源也在社交的过程中不断地交流和传播,并且由于这些信息不仅可能包含用户的隐私信息,而且可能会是某些公司的商业机密,因而其信息价值越来越被认可。伴随着微博、人人等社交应用的蓬勃兴起,基于社交网络的安全问题也越来越突出,例如,近年来利用社交网络实施的钓鱼欺诈行为数量正急剧增加。

社交网好友关系间的信任和认可,是不法分子实施恶意活动的出发点,而这也是社交网络产生安全问题的根源。不法分子通过盗取用户帐号来实施窃取用户信息、诱骗广告点击、借钱欺诈等非法活动。近年来,许多安全公司给出的报告里都表明,有1/4左右的借钱欺诈、虚拟抽奖等网络钓鱼的恶意活动是通过社交网络传播的,并且这些安全公司的分析预测也称,全方位改善社交安全将成为网络安全新课题。

发明内容

鉴于此,本发明的目标是针对社交网络正常帐号被盗后发布诈骗、钓鱼、垃圾信息等恶意消息这类异常事件,提出一种异常事件检测方法,此方法基于网络爬虫技术爬取用户行为数据,基于用户行为分析技术和数学建模思想进行行为建模和分析检测,当检测到异常账户时发出短信告警,可为社交网提供者提供异常用户列表,从而大大减少网络诈骗、钓鱼和垃圾信息对网民的危害,同时该方法作为Web安全检测的一部分,对研究Web环境下的安全问题也具有一定的参考价值和指导意义。

本发明提出的社交网异常事件检测方法基于网络爬虫技术和Web解析技术获取用户在社交网中发布的消息数据,然后对这些数据进行用户行为分析,从而检测出异常用户,并进行告警。使用本方法可以检测目标社交网站(人人网、微博等)存在的异常事件,包括盗取帐号发广告、发布恶意链接、网络“灌水”、骗取社交好友钱财等等。本发明主要由三个主要功能单元组成,即数据获取单元、分析检测单元和异常报警单元。

所述的数据获取单元的功能特点如下:

获得目标检测社交网的操作权限,通过网络爬虫技术来完成对用户消息数据(发布状态、日志、照片、分享、评论等信息)的抓取,对抓取下来的数据解析后按用户进行分类并存入文件,这些文件就是分析检测单元的输入。

本单元主要包括用户登录、数据抓取、数据解析和数据输出四个子单元。

所述的用户登录子单元的功能特点如下:

创建一个Singleton Connector类,使用DefaultHttpClient、HttpGet和HttpPost。HttpGet用来获取人人网入口URL,HttpPost中设定人人网登录URL,同时设定登录用户的基本信息(包括用户名、密码、人人网域名等,这些参数信息可从配置单元取到)。然后执行login()方法,如果进入到了登录后的页面,就表明已成功登录,然后将用户凭据信息作为Cookie保存下来,以便下次抓取时使用。

所述的数据抓取子单元的功能特点如下:

实现ICrawler接口和IParser接口,其中IParser接口继承HtmlParser。该单元主要包括CrawlFeeds类、CrawlTimelineFeed类、FilterOpenUser类和FeedController类。其中FeedController类严格意义上不属于数据抓取单元,因为它用来控制数据抓取和数据输出存储。用户登录后,首先FilterOpenUser从登录的用户节点开始获取每一个待抓用户所有相关的URL。如果该待抓用户是登录用户的好友,则可以直接爬取;如果不是好友的话,有的信息需要加了好友后才能查看,通过这样的方式得到所有可查看的userId列表。然后FeedController以FilterOpenUser得到的userId列表为输入,调用CrawlFeeds或CrawlTimelineFeed进行爬取。在抓取的时候,采用定时器的增量式抓取方法。定时器的方法通过设定具体的时间间隔进行抓取。具体的时间间隔由配置单元设定。爬取时就是按照userId进行分别爬取。

所述的数据解析子单元的功能特点如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410101728.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top