[发明专利]社交网络中基于多视图融合的用户审计方法有效
申请号: | 202011165375.5 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112365356B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 杨晓晖;梁笑 | 申请(专利权)人: | 河北大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06V10/74;G06V10/774;G06V10/764;G06V10/80;G06K9/62 |
代理公司: | 石家庄国域专利商标事务所有限公司 13112 | 代理人: | 胡素梅 |
地址: | 071002 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 基于 视图 融合 用户 审计 方法 | ||
本发明提供了一种社交网络中基于多视图融合的用户审计方法。该方法重点包括特征提取和多视图融合两个阶段。首先,设计综合多视图信息的用户表征策略,分别构建用户行为、社交关系、文章内容三个视图对用户进行表征。针对现有方法未充分考虑用户粉丝及用户在社交网络中所处环境的不足,引入粉丝比率、粉丝平均双向连接率、基于社区的双向连接率、基于社区的集群系数等新特征。然后,构建基于线性加权函数的多视图融合决策模型,将来自各视图的分类结果进行线性加权融合,并通过最小化近似误差求得最优融合系数进而得到最终分类结果。与现有技术相比,本发明能够有效检测垃圾用户,有更高精确率和F1值,且在应对不平衡数据时表现出更强的稳定性。
技术领域
本发明涉及社交网络安全领域,具体地说是一种社交网络中基于多视图融合的用户审计方法。
背景技术
在社交网络中,包括社交网站的社交网络系统能够使其用户(诸如个人或组织)与其交互,且用户通过其彼此交互。随着用户的输入,社交网络系统可以创建和储存与用户相关的用户配置文件。用户配置文件可包括用户的个人统计信息、通信渠道信息以及个人行为信息等。随着用户的使用,社交网络系统还可以创建和储存该用户与社交网络上的其他用户之间的关系记录,并且为促进两个用户或多个用户之间的社交提供服务(例如点赞、评论、话题、发私信等)。
微博等社交网络平台一方面给人们的生活带来便利,同时也给垃圾用户提供了良好的发展环境。社交网络上垃圾用户利用微博发布大量垃圾信息或请求,甚至涉及恶意URL链接、虚假广告、网络钓鱼、欺诈、色情等内容,给用户的财产安全带来巨大的隐患。此外,无用信息占据网络资源,消耗了大量的网络负载。垃圾用户检测作为社交网络环境维护中的基本任务有助于消除微博垃圾用户所带来的负面影响,维护社交网络的安全,改善用户的使用体验。
微博垃圾用户检测可以转化为分类问题,即基于分类的垃圾用户识别。其中,需要提取用户的各方面特征,特征提取的完整及合理程度直接影响识别的结果。当前,对于在线社交网络上的用户进行表征应考虑以下几个方面:基于用户配置文件相关的账号基本信息(包括账号注册日期、个人简介等)、基于用户使用行为相关的信息、基于用户间社交关系的信息、基于用户发布微博内容的信息。
集成学习(ensemble learning)是一种分类器融合方法,有时也被称为多分类器系统(multi-classifier system),其一般结构为:先产生一组“个体学习器”,再用某种策略将它们结合起来。集成学习在分类任务的很多领域已经得到了广泛的应用,并且取得了很好的效果,但目前基于集成学习思想的微博垃圾用户检测方法还不是很成熟。
发明内容
本发明的目的就是提供一种社交网络中基于多视图融合的用户审计方法,通过该方法对社交网络中的用户进行审计,以检测出非正常的垃圾用户,该方法具有识别准确率高、适用性强的优点。
本发明是这样实现的:本发明的方法中,利用了一种综合多视图信息的用户表征策略和基于线性加权函数的融合决策模型。该方法重点包括两个阶段:第一阶段:特征提取;第二阶段:多视图融合决策。该方法包含以下内容:
1.一种综合多视图信息的用户表征策略
在本发明的第一阶段中,提供了一种完整且有效的特征构造方法,以对社交网络(例如微博)上的用户进行表征,即图1中的“特征提取”。本发明构建了一种基于多视图的用户表征策略,用于对用户的特点进行更加全面的描述。具体是:分别构建用户行为、社交关系、微博内容三个视图对用户进行表征。本阶段针对现有方法未充分考虑用户粉丝及用户在社交网络中所处环境的不足,引入粉丝比率、粉丝平均双向连接率、基于社区的双向连接率、基于社区的集群系数等新特征。
2.多视图融合决策,用于垃圾用户识别
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北大学,未经河北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011165375.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显示面板和显示设备
- 下一篇:一种数据安全下载方法和系统