[发明专利]一种基于图注意力网络的社交机器人识别方法有效
申请号: | 202010044446.X | 申请日: | 2020-01-15 |
公开(公告)号: | CN111274491B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 颜成钢;阮定;孙垚棋;张继勇;张勇东 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 网络 社交 机器人 识别 方法 | ||
本发明提供本发明一种基于图注意力网络的社交机器人识别方法。本发明方法基于图注意力网络,通过对社交网络上发布的内容进行自然语言处理构建节点特征,各社交账号之间的转发、评论关系来构建图,然后进行分类,从而判断出该账号是否为社交机器人。首先社交网络数据,进行数据集的创建,然后构建图注意力网络,通过创建的数据集进行图注意力网络的训练和测试。针对复杂的社交网络机器人识别问题,本发明方法能够自动高效的识别社交机器人,减少不法分子的可乘之机,从而限制机器人发布的言论,削弱不良社会舆论影响,有利于维护社会和谐稳定。
技术领域
本发明涉及图注意力网络的应用领域,具体涉及基于图注意力网络节点分类技术及其实际应用于社交网络的领域。
背景技术
近年来,随着社交网络的发展,个人可以充分地在网络上发出自己的声音,但也让不法分子有了可乘之机,在网上肆意发布不良内容。尤其是在充斥着大量水军,僵尸粉的微博上,社交机器人可以发布大量的内容从而影响舆论导向,所以需要一个系统能够识别出社交机器人,控制机器人发布的言论带来的社会影响。
在计算机科学中,图是由顶点和边两部分组成的一种数据结构。图G可以通过顶点集合V和它包含的边E来描述,即:
G=(V,E) (1)
顶点也称节点,两个术语是可以互换的。
图注意力网络是一种直接作用于图上的神经网络。GAT的一个典型作用是节点分类。本质上,图中每个节点都与一个标签相关联,通过图注意力网络就能够预测未标记节点的标签。
图注意力网络采用多头注意力机制,相较图卷积神经网络能够更准确地对各节点进行分类。而且其注意力机制更适用于拥有不同的度和不同权重的边的社交网络,最重要的是这一算法可直接用于归纳学习问题。
而在社交网络中,社交机器人所发送内容大体相同,可以利用自然语言处理获取每个社交机器人的特征,然后通过转发、评论关系构建图,获取这样的数据集后,就可以利用图注意力网络对节点进行分类。
发明内容
针对现有技术存在的不足,本发明提供本发明一种基于图注意力网络的社交机器人识别方法。本发明方法基于图注意力网络,通过对社交网络上发布的内容进行自然语言处理构建节点特征,各社交账号之间的转发、评论关系来构建图,然后进行分类,从而判断出该账号是否为社交机器人。
一种基于图注意力网络的社交机器人识别方法,步骤如下:
步骤(1)、搜集社交网络数据。
人工搜集一段时间内社交平台上部分账号发布的内容,以及各账号之间的评论关系。对社交平台上某一账号发布的内容进行记录,搜集该条内容下的评论账号发布的实质性评论内容以及评论的评论。同时根据账号所发布的内容及评论关系判断该账号是否为机器人。
步骤(2)、创建数据集。
对所有搜集到的账号发布的实质性内容进行自然语言处理获取特征,各个账号作为图的顶点,账号间的评论关系形成图的边,并对每个账号都注明是否为机器人,由此形成数据集。将数据集分为两个部分,第一部分包括账号的ID,特征和类别,第二部分为各账号之间的评论关系。其中训练集,验证集和测试集所占比例约为6:2:2。
步骤(3)、构建图注意力网络
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010044446.X/2.html,转载请声明来源钻瓜专利网。