[发明专利]基于用户关系结构特征的微博谣言检测方法和系统在审
申请号: | 201910489380.2 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110362818A | 公开(公告)日: | 2019-10-22 |
发明(设计)人: | 黄琪;周川;胡玥;谭建龙;郭莉 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06N3/04;G06F16/951 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 邱晓锋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 向量 用户关系 传播 检测 建模 输入神经网络 用户行为信息 关系结构图 用户编码器 数据流 传播过程 传播路径 构造用户 检测系统 向量表示 用户特征 编码器 集成器 流数据 正确率 话题 级联 | ||
本发明涉及一种基于用户关系结构特征的微博谣言检测方法和系统。该方法包括以下步骤:1)根据用户行为信息构造用户关系结构图,对所述用户关系结构图进行建模得到用户向量;2)根据微博话题流数据的传播路径构造传播树,对所述传播树进行编码得到传播树向量;3)将所述用户向量和所述传播树向量进行级联,并输入神经网络来判断微博话题是否为谣言。该系统包括用户编码器、传播树编码器和集成器。本发明对谣言传播过程中参与的用户进行建模,得到微博数据流中所有用户的向量表示,在谣言检测过程中增加了有用的检测因素,即体现了用户特征的作用,提高了谣言检测系统的正确率和F1值。
技术领域
本发明属于人工智能、智能文本分析、舆情分析技术领域,涉及谣言检测方法,具体涉及一种基于用户关系结构特征的微博谣言检测方法和系统。
背景技术
微博谣言是指通过社交媒体网络(例如新浪微博、腾讯微博、Twitter等)而传播的编造的没有事实根据的论述。微博谣言涉及社会、政治、经济、文化等内容,如社会突发事件、政治选举、热点事件等。微博谣言的传播具有突发性、传播速度快和影响范围广等特点,因此其对国家和社会极易造成较大的危害。例如,某人因为长相与某案件中的嫌疑人相似而被人肉,给其工作和生活带来了极大的困扰且损害了其个人形象和名誉。
针对社交网络谣言的检测方法主要集中在分析谣言的文本内容、谣言的传播过程和谣言发布者特征三个方面,当前方法可以分为两大类:关注谣言文本内容特征模式和关注谣言传播结构模式。
通过分析谣言文本的内容特征,zhao等人(Z.Zhao,P.Resnick,and Q.Mei,“Enquiring Minds:Early Detection of Rumors in Social Media from EnquiryPosts,”in Proceedings of the 24th International Conference on World Wide Web,2015,pp.1395-1405.)提出了一组正则表达式集合来识别微博数据流中的谣言信号博文,之后对信号推文进行聚类,利用机器学习方法判定类簇是否为谣言。Gupta等人(AditiGupta,Ponnurangam Kumaraguru,Carlos Castillo,and Patrick Meier,“Tweetcred:Real-time credibility assessment of content on twitter,”In Proceedings of theInternational Conference on Social Informatics.Springer,2014,pp.228–243.)发现相对于正常文本,谣言文本包含更多发誓性的词语和人称代词,因此利用这类文本特征作为谣言指示器可以检测出谣言文本。为了对谣言数据流在时序上的变化进行建模,Kwon等人(S.Kwon,M.Cha,K.Jung,W.Chen,and Y.Wang,“Prominent features of umorpropagation in online social media,”in Proceedings of the 13th InternationalConference on Data Mining,2013,pp.1103-1108.)提出对博文数量在时间上变化进行建模,在此基础上,Ma等人(J.Ma,W.Gao,Z.Wei,Y.Lu,and K.-F.Wong,“Detect rumors usingtime series of social context information on microblogging websites,”inProceedings of the 24th ACM International on Conference on Information andKnowledge Management,2015,pp.1751-1754.)将时序上变化的特征进行了扩展。由于神经网络模型在其他任务上的优异表现,Ma等人(J.Ma,W.Gao,P.Mitra,S.Kwon,B.Jansen,K.-F.Wong,and M.Cha,“Detecting rumors from microblogs with recurrent neuralnetworks,”in Proceedings of the 25th International Joint Conference onArtificial Intelligence,2016,pp.3818-3824.)利用循环神经网络(RNN)来提取谣言文本内容信息对谣言进行检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910489380.2/2.html,转载请声明来源钻瓜专利网。