[发明专利]融合用户行为和文本信息的社交机器人检测方法和系统有效
申请号: | 201810396753.7 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108763319B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 刘春阳;张旭;蔡驰宇;曾大军;李雄;李林静;王萌;彭鑫;王慧 | 申请(专利权)人: | 中国科学院自动化研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06N3/04;G06Q50/00 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 郭文浩;陈晓鹏 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 用户 行为 文本 信息 社交 机器人 检测 方法 系统 | ||
本发明属于计算机技术领域,具体提供了一种融合用户行为和文本信息的社交机器人检测方法和系统。旨在解决现有技术手动选取特征、忽略社交媒体帖子之间的逻辑性和时序性以及忽略社交平台用户行为信息的问题,本发明的社交机器人的检测方法包括获取待检测社交媒体用户的历史网络数据和好友网络数据;基于上述数据得到用户文本特征向量、行为特征向量以及好友网络特征向量,并将其融合,得到待检测社交媒体用户的用户特征向量;对用户特征向量进行检测,输出检测结果。本发明的方法更加符合社交媒体自身的特性,从多个维度分析待检测社交媒体用户,提升了检测准确率。本发明的系统同样具有上述有益效果。
技术领域
本发明属于计算机技术领域,具体涉及一种融合用户行为和文本信息的社交机器人检测方法和系统。
背景技术
随着互联网技术与社交媒体平台的高速发展,国内外各大主流社交媒体平台中存在着大量的社交机器人,这些社交机器人制造并发布虚假消息,传播谣言,制造网络陷阱,影响甚至操控舆论发展趋势,这些行为严重干扰了网民的正常生活,威胁社交媒体用户的隐私安全,更有甚者会对社会造成不好的影响,因此,如何准确地检测社交媒体平台中的机器人,预防社交机器人带来的负面影响,具有十分重要的实用价值。
早期的社交机器人识别主要依赖于特定的人工策略,以社交机器人通过广泛交友来提高自身影响力为出发点,随机制造大量的检测种子账号,这些账号没有实际的行为,也不会发表有意义的内容,因此人类用户不会与其建立友好关系,最后通过一系列的规则从与种子账号建立友好关系的账号中检测社交机器人,但是该方法原始简单,需要耗费较多的人力和时间,因此无法很好地应用在实践中;接着基于网络结构分析的社交机器人的分析方法被提出,该方法通过假设垃圾账号只会与少数真实用户连接,其余的大部分均为垃圾账号,通过该特点来识别密集连接的垃圾账号;针对社交媒体的文本信息,基于语言特征的相关方法被提出,该方法通过分析特定的词汇与标点符号,统计分析发布文本信息的平均长度,统计文本中URL(Uniform Resoure Locator,统一资源定位符)的平均长度等。
现有技术的社交机器人检测方法主要存在以下问题:1、基于现有的统计方法和机器学习方法,需要手动选取特征,耗费大量的人力成本;2、现有的社交机器人检测方法将用户发布的内容作为纯文本信息看待,忽视了社交媒体帖子之间的逻辑性和时序性;3、现有技术的方法往往忽略了社交平台中用户的行为信息,或者只采用简单的统计方法分析,无法有效地分析利用社交平台中的用户行为信息。
因此,如何提出一种解决上述问题的方案是本领域技术人员目前需要解决的问题。
发明内容
为了解决现有技术中的上述问题,本发明提供了一种融合用户行为和文本信息的社交机器人检测方法,包括:
获取待检测社交媒体用户的历史网络数据和好友网络数据;
基于预先构建的第一向量转化模型将所述历史网络数据转化为用户文本特征向量;
基于预先构建的第二向量转化模型将所述历史网络数据转化为行为特征向量;
基于预先构建的第三向量转化模型将所述好友网络数据转化为好友网络特征向量;
将所述用户文本特征向量、行为特征向量以及好友网络特征向量进行融合,得到所述待检测社交媒体用户的用户特征向量;
基于预先构建的分类检测模型对所述用户特征向量进行检测,输出检测结果;
其中,
所述第一向量转化模型、第二向量转化模型、第三向量转化模型以及分类检测模型均是基于预设的训练集,并利用深度神经网络构建的模型。
在上述方法的优选技术方案中,所述历史网络数据包括文本数据,“将所述历史网络数据转化为用户文本特征向量”的步骤包括:
基于词向量模型将所述文本数据映射为文本矩阵序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;国家计算机网络与信息安全管理中心,未经中国科学院自动化研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810396753.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:物品推荐方法和装置
- 下一篇:一种书写笔记数据存储方法、装置、终端及存储介质