[发明专利]基于三元图卷积神经网络的社交机器人检测系统及方法在审
申请号: | 202211521215.9 | 申请日: | 2022-11-30 |
公开(公告)号: | CN116186636A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 杨春芳;刘峰;李震宇;刘粉林;巩道福;罗向阳;刘琰;齐保军;朱玛 | 申请(专利权)人: | 中国人民解放军战略支援部队信息工程大学 |
主分类号: | G06F18/25 | 分类号: | G06F18/25;G06F18/2415;G06F18/2433;G06N3/042;G06N3/0464;G06N3/0455;G06N3/047;G06N3/048;G06F40/30;H04L9/40;G06Q50/00;G06F123/02 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 石丹丹 |
地址: | 450000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 三元 图卷 神经网络 社交 机器人 检测 系统 方法 | ||
本发明属于社交网络技术领域,具体涉及一种基于三元图卷积神经网络的社交机器人检测系统及方法,该方法包括对社交网络提取账户的语义特征、属性特征和社区结构特征;对语义特征、属性特征和社区结构特征向量化,特征向量通过拼接方式融合形成账户初始表示向量;使用关注‑被关注关系构建有向图,利用图神经网络聚合节点邻居特征和初始特征,利用交叉熵损失函数作为图神经网络的损失函数,训练图神经网络得到最终的节点表示向量;将最终的节点表示向量通过图神经网络的softmax层分类为社交机器人或者正常用户。本发明同时考虑了账户的语义特征、属性特征和社区结构特征,采用多元特征嵌入图神经网络检测社交机器人,提高了对社交机器人检测的准确性。
技术领域
本发明属于社交网络技术领域,具体涉及一种基于三元图卷积神经网络的社交机器人检测系统及方法。
背景技术
恶意社交机器人是由自动化程序或者API控制的并在社交网络中执行各种恶意活动社交账户,这类账户被研究者称为bot accounts、Sybils、或者fake accounts。在线社交网络在营销、新闻、公共关系、大众信息活动、娱乐以及全球和国家重大活动中的爆炸性使用为社交机器人的发展提供了机会。
社交平台和研究者们为了尽可能降低恶意社交机器人的影响,提出了一系列社交机器人检测技术,并在早期取得了成功。这些检测方法可以归为两类:基于账户特征的方法和基于图结构的方法。现有的最先进的基于账户特征的方法有三个主要的局限性:1、它包含人类的局限和偏见。2、需要从大量数据中挖掘潜在的特征,特征工程的成本很高。3、模型的泛化能力因不同OSN存在不同的特征而受到限制。
为了应对这些挑战,部分研究者利用账户在社交网络中的交互关系构建社交图,使用图挖掘技术将其划分为内聚子图。这类方法通常仅考虑利用在线社交网络中社交机器人的链接关系,而忽略了嵌入在文本、时间和简介信息中的自动化线索。因此,这些方法无法检测出那些成功地与普通用户建立了足够攻击边缘(链接)的社交机器人。
发明内容
针对现有技术中存在的问题,本发明提出一种基于三元图卷积神经网络的社交机器人检测系统及方法,同时考虑了账户的语义特征、属性特征和社区结构特征,采用多元特征嵌入图神经网络检测社交机器人,提高了对社交机器人检测的准确性。
为了实现上述目的,本发明采用以下的技术方案:
本发明提供了一种基于三元图卷积神经网络的社交机器人检测系统,包括:
输入模块,对社交网络提取账户的语义特征、属性特征和社区结构特征;
预处理模块,对语义特征、属性特征和社区结构特征向量化,利用全连接将得到的特征向量进行缩放,使特征向量维度一致,特征向量再通过拼接方式融合形成账户初始表示向量;
节点表示模块,将预处理模块得到的账户初始表示向量作为每个账户的初始特征,使用关注-被关注关系构建有向图,利用图神经网络消息传递机制聚合节点邻居特征和初始特征,利用交叉熵损失函数作为图神经网络的损失函数,训练图神经网络得到最终的节点表示向量;
输出模块,将最终的节点表示向量通过图神经网络的softmax层分类为社交机器人或者正常用户。
进一步地,所述语义特征包括账户描述信息和账户推文信息,所述属性特征包括数字信息和类别信息,所述社区结构特征包括账户社区结构信息。
进一步地,使用RoBERTa模型分别对账户描述信息和账户推文信息进行编码后得到账户描述信息的表示向量和账户推文信息的表示向量;表示为:给定账户l的语义特征向量由账户描述信息语义向量和账户推文信息语义向量两部分组成,即Ul∈U。
进一步地,使用Z-Score对属性特征中的数字信息归一化处理并组合成数字特征向量使用One-hot对属性特征中的类别信息编码并组合成类别特征向量最终得到给定账户l的属性特征向量
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军战略支援部队信息工程大学,未经中国人民解放军战略支援部队信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211521215.9/2.html,转载请声明来源钻瓜专利网。