[发明专利]融合用户行为和文本信息的社交机器人检测方法和系统有效
申请号: | 201810396753.7 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108763319B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 刘春阳;张旭;蔡驰宇;曾大军;李雄;李林静;王萌;彭鑫;王慧 | 申请(专利权)人: | 中国科学院自动化研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06N3/04;G06Q50/00 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 郭文浩;陈晓鹏 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融合 用户 行为 文本 信息 社交 机器人 检测 方法 系统 | ||
1.一种融合用户行为和文本信息的社交机器人检测方法,其特征在于包括:
获取待检测社交媒体用户的历史网络数据和好友网络数据;
基于预先构建的第一向量转化模型将所述历史网络数据转化为用户文本特征向量;
基于预先构建的第二向量转化模型将所述历史网络数据转化为行为特征向量;
基于预先构建的第三向量转化模型将所述好友网络数据转化为好友网络特征向量;
将所述用户文本特征向量、行为特征向量以及好友网络特征向量进行融合,得到所述待检测社交媒体用户的用户特征向量;
基于预先构建的分类检测模型对所述用户特征向量进行检测,输出检测结果;
其中,
所述第一向量转化模型、第二向量转化模型、第三向量转化模型以及分类检测模型均是基于预设的训练集,并利用深度神经网络构建的模型;
所述历史网络数据包括行为数据,“将所述历史网络数据转化为行为特征向量”的步骤包括:
构建内在因素行为建模组件和外在因素行为建模组件;
基于所述内在因素行为建模组件将所述行为数据编码为内在行为向量;
基于所述外在因素行为建模组件将所述内在行为向量编码为外在行为向量;
通过循环神经网络将所述外在行为向量编码为行为特征向量,其中,所述行为特征向量包括原创行为特征向量和转发行为特征向量。
2.根据权利要求1所述的融合用户行为和文本信息的社交机器人检测方法,其特征在于,所述历史网络数据包括文本数据,“将所述历史网络数据转化为用户文本特征向量”的步骤包括:
基于词向量模型将所述文本数据映射为文本矩阵序列;
利用卷积神经网络将所述文本矩阵序列编码为文本特征向量序列;
利用循环神经网络将所述文本特征向量序列编码为用户文本特征向量。
3.根据权利要求2所述的融合用户行为和文本信息的社交机器人检测方法,其特征在于,“利用卷积神经网络将所述文本矩阵序列编码为文本特征向量序列”的步骤包括:
利用所述卷积神经网络,并按照下式所示的方法对所述文本矩阵序列进行卷积操作,得到特征映射矩阵:
其中,S表示所述文本矩阵序列,Fl表示过滤器,*表示卷积运算,m表示过滤器的宽度,ω表示文本数据的长度,S[:,k-m+1:k]表示一个m维的矩阵切片,其中:表示矩阵S的所有行,k-m+1:k表示矩阵S从第k-m+1列到第k列的共m列,k表示中间变量;
利用所述卷积神经网络的池化层对所述特征映射矩阵进行池化操作,得到文本特征向量序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;国家计算机网络与信息安全管理中心,未经中国科学院自动化研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810396753.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:物品推荐方法和装置
- 下一篇:一种书写笔记数据存储方法、装置、终端及存储介质