[发明专利]基于用户关系结构特征的微博谣言检测方法和系统在审

专利信息
申请号: 201910489380.2 申请日: 2019-06-06
公开(公告)号: CN110362818A 公开(公告)日: 2019-10-22
发明(设计)人: 黄琪;周川;胡玥;谭建龙;郭莉 申请(专利权)人: 中国科学院信息工程研究所
主分类号: G06F17/27 分类号: G06F17/27;G06N3/04;G06F16/951
代理公司: 北京君尚知识产权代理事务所(普通合伙) 11200 代理人: 邱晓锋
地址: 100093 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 微博 向量 用户关系 传播 检测 建模 输入神经网络 用户行为信息 关系结构图 用户编码器 数据流 传播过程 传播路径 构造用户 检测系统 向量表示 用户特征 编码器 集成器 流数据 正确率 话题 级联
【说明书】:

发明涉及一种基于用户关系结构特征的微博谣言检测方法和系统。该方法包括以下步骤:1)根据用户行为信息构造用户关系结构图,对所述用户关系结构图进行建模得到用户向量;2)根据微博话题流数据的传播路径构造传播树,对所述传播树进行编码得到传播树向量;3)将所述用户向量和所述传播树向量进行级联,并输入神经网络来判断微博话题是否为谣言。该系统包括用户编码器、传播树编码器和集成器。本发明对谣言传播过程中参与的用户进行建模,得到微博数据流中所有用户的向量表示,在谣言检测过程中增加了有用的检测因素,即体现了用户特征的作用,提高了谣言检测系统的正确率和F1值。

技术领域

本发明属于人工智能、智能文本分析、舆情分析技术领域,涉及谣言检测方法,具体涉及一种基于用户关系结构特征的微博谣言检测方法和系统。

背景技术

微博谣言是指通过社交媒体网络(例如新浪微博、腾讯微博、Twitter等)而传播的编造的没有事实根据的论述。微博谣言涉及社会、政治、经济、文化等内容,如社会突发事件、政治选举、热点事件等。微博谣言的传播具有突发性、传播速度快和影响范围广等特点,因此其对国家和社会极易造成较大的危害。例如,某人因为长相与某案件中的嫌疑人相似而被人肉,给其工作和生活带来了极大的困扰且损害了其个人形象和名誉。

针对社交网络谣言的检测方法主要集中在分析谣言的文本内容、谣言的传播过程和谣言发布者特征三个方面,当前方法可以分为两大类:关注谣言文本内容特征模式和关注谣言传播结构模式。

通过分析谣言文本的内容特征,zhao等人(Z.Zhao,P.Resnick,and Q.Mei,“Enquiring Minds:Early Detection of Rumors in Social Media from EnquiryPosts,”in Proceedings of the 24th International Conference on World Wide Web,2015,pp.1395-1405.)提出了一组正则表达式集合来识别微博数据流中的谣言信号博文,之后对信号推文进行聚类,利用机器学习方法判定类簇是否为谣言。Gupta等人(AditiGupta,Ponnurangam Kumaraguru,Carlos Castillo,and Patrick Meier,“Tweetcred:Real-time credibility assessment of content on twitter,”In Proceedings of theInternational Conference on Social Informatics.Springer,2014,pp.228–243.)发现相对于正常文本,谣言文本包含更多发誓性的词语和人称代词,因此利用这类文本特征作为谣言指示器可以检测出谣言文本。为了对谣言数据流在时序上的变化进行建模,Kwon等人(S.Kwon,M.Cha,K.Jung,W.Chen,and Y.Wang,“Prominent features of umorpropagation in online social media,”in Proceedings of the 13th InternationalConference on Data Mining,2013,pp.1103-1108.)提出对博文数量在时间上变化进行建模,在此基础上,Ma等人(J.Ma,W.Gao,Z.Wei,Y.Lu,and K.-F.Wong,“Detect rumors usingtime series of social context information on microblogging websites,”inProceedings of the 24th ACM International on Conference on Information andKnowledge Management,2015,pp.1751-1754.)将时序上变化的特征进行了扩展。由于神经网络模型在其他任务上的优异表现,Ma等人(J.Ma,W.Gao,P.Mitra,S.Kwon,B.Jansen,K.-F.Wong,and M.Cha,“Detecting rumors from microblogs with recurrent neuralnetworks,”in Proceedings of the 25th International Joint Conference onArtificial Intelligence,2016,pp.3818-3824.)利用循环神经网络(RNN)来提取谣言文本内容信息对谣言进行检测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910489380.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top