[发明专利]基于用户关系结构特征的微博谣言检测方法和系统在审

申请号：	201910489380.2	申请日：	2019-06-06
公开（公告）号：	CN110362818A	公开（公告）日：	2019-10-22
发明（设计）人：	黄琪;周川;胡玥;谭建龙;郭莉	申请（专利权）人：	中国科学院信息工程研究所
主分类号：	G06F17/27	分类号：	G06F17/27;G06N3/04;G06F16/951
代理公司：	北京君尚知识产权代理事务所(普通合伙) 11200	代理人：	邱晓锋
地址：	100093 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	微博向量用户关系传播检测建模输入神经网络用户行为信息关系结构图用户编码器数据流传播过程传播路径构造用户检测系统向量表示用户特征编码器集成器流数据正确率话题级联
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于用户关系结构特征的微博谣言检测方法和系统。该方法包括以下步骤：1)根据用户行为信息构造用户关系结构图，对所述用户关系结构图进行建模得到用户向量；2)根据微博话题流数据的传播路径构造传播树，对所述传播树进行编码得到传播树向量；3)将所述用户向量和所述传播树向量进行级联，并输入神经网络来判断微博话题是否为谣言。该系统包括用户编码器、传播树编码器和集成器。本发明对谣言传播过程中参与的用户进行建模，得到微博数据流中所有用户的向量表示，在谣言检测过程中增加了有用的检测因素，即体现了用户特征的作用，提高了谣言检测系统的正确率和F1值。

技术领域

本发明属于人工智能、智能文本分析、舆情分析技术领域，涉及谣言检测方法，具体涉及一种基于用户关系结构特征的微博谣言检测方法和系统。

背景技术

微博谣言是指通过社交媒体网络(例如新浪微博、腾讯微博、Twitter等)而传播的编造的没有事实根据的论述。微博谣言涉及社会、政治、经济、文化等内容，如社会突发事件、政治选举、热点事件等。微博谣言的传播具有突发性、传播速度快和影响范围广等特点，因此其对国家和社会极易造成较大的危害。例如，某人因为长相与某案件中的嫌疑人相似而被人肉，给其工作和生活带来了极大的困扰且损害了其个人形象和名誉。

针对社交网络谣言的检测方法主要集中在分析谣言的文本内容、谣言的传播过程和谣言发布者特征三个方面，当前方法可以分为两大类：关注谣言文本内容特征模式和关注谣言传播结构模式。

通过分析谣言文本的内容特征，zhao等人(Z.Zhao,P.Resnick,and Q.Mei,“Enquiring Minds:Early Detection of Rumors in Social Media from EnquiryPosts,”in Proceedings of the 24th International Conference on World Wide Web,2015,pp.1395-1405.)提出了一组正则表达式集合来识别微博数据流中的谣言信号博文，之后对信号推文进行聚类，利用机器学习方法判定类簇是否为谣言。Gupta等人(AditiGupta,Ponnurangam Kumaraguru,Carlos Castillo,and Patrick Meier,“Tweetcred:Real-time credibility assessment of content on twitter,”In Proceedings of theInternational Conference on Social Informatics.Springer,2014,pp.228–243.)发现相对于正常文本，谣言文本包含更多发誓性的词语和人称代词，因此利用这类文本特征作为谣言指示器可以检测出谣言文本。为了对谣言数据流在时序上的变化进行建模，Kwon等人(S.Kwon,M.Cha,K.Jung,W.Chen,and Y.Wang,“Prominent features of umorpropagation in online social media,”in Proceedings of the 13th InternationalConference on Data Mining,2013,pp.1103-1108.)提出对博文数量在时间上变化进行建模，在此基础上，Ma等人(J.Ma,W.Gao,Z.Wei,Y.Lu,and K.-F.Wong,“Detect rumors usingtime series of social context information on microblogging websites,”inProceedings of the 24th ACM International on Conference on Information andKnowledge Management,2015,pp.1751-1754.)将时序上变化的特征进行了扩展。由于神经网络模型在其他任务上的优异表现，Ma等人(J.Ma,W.Gao,P.Mitra,S.Kwon,B.Jansen,K.-F.Wong,and M.Cha,“Detecting rumors from microblogs with recurrent neuralnetworks,”in Proceedings of the 25th International Joint Conference onArtificial Intelligence,2016,pp.3818-3824.)利用循环神经网络(RNN)来提取谣言文本内容信息对谣言进行检测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所，未经中国科学院信息工程研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910489380.2/2.html，转载请声明来源钻瓜专利网。

上一篇：一种面向产品属性的观点倾向性分析方法及系统
下一篇：基于卷积神经网络的文本情感分析方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于用户关系结构特征的微博谣言检测方法和系统在审

专利文献下载