[发明专利]一种基于社交网络分析的微博诈骗团体挖掘方法在审
申请号: | 201611203131.5 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106599273A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 贾志娟;张玉;周娜;孔珊;王宁 | 申请(专利权)人: | 贾志娟 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 450044 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社交 网络分析 诈骗 团体 挖掘 方法 | ||
1.一种基于社交网络分析的微博诈骗团体挖掘方法,其特征在于它包括以下步骤:
①.微博数据采集;
②.对所采集数据进行处理;
③.诈骗团体社交网络分析特征获取和文本特征的挖掘;
④.对诈骗团体进行预测和评估。
2.根据权利要求1所述的一种基于社交网络分析的微博诈骗团体挖掘方法,其特征在于所述步骤①中的微博数据采集包括以下步骤:
a.首先模拟打开浏览器,并跳转到话题所在的微博详情页;
b.通过Seleniu工具获取到所述微博详情页页面上的所有数据信息,并通过获取DOM元素,定位到该条微博的转发以及评论所在的地方;
c.将爬虫得到的数据暂时保存,并将数据分类并处理;
d.接处理好的数据保存到本地的数据库中,以供使用。
3.根据权利要求1所述的一种基于社交网络分析的微博诈骗团体挖掘方法,其特征在于所述步骤②的数据处理包括对步骤①采集到的数据进行预处理、断词处理和特征值提取,所述预处理包括去重、机械压缩去词和短句删除,所述特征值提取是采用TF-IDF算法来计算词的重要性,最重要的词即为特征值。
4.根据权利要求1所述的一种基于社交网络分析的微博诈骗团体挖掘方法,其特征在于所述步骤③具体包括从整体社交网络的角度对诈骗团体进行社会特征值的挖掘、通过网络密度分析可以对诈骗团体的训练集中社会网络之内部节点互动链接的强度进行大致的了解、从网络节点的角度进行分析和通过文本挖掘获取特征关键词。
5.根据权利要求1所述的一种基于社交网络分析的微博诈骗团体挖掘方法,其特征在于所述步骤④包括内容特征对比和社会网络特征对比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贾志娟,未经贾志娟许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611203131.5/1.html,转载请声明来源钻瓜专利网。