[发明专利]基于动态子图生成方法挖掘关键局部争论进行争议性检测的方法在审
申请号: | 202110689802.8 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113297497A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 曹娟;钟雷;盛强;谢添;徐朝喜 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 生成 方法 挖掘 关键 局部 争论 进行 争议 检测 | ||
本发明提供一种基于动态子图生成方法挖掘关键局部争论进行争议性检测的方法,包括:步骤C1,基于动态子图生成方法获取帖子‑评论图中的所有子图集合;步骤C2,基于所述子图集合,利用图神经网络预测帖子具有争议性的概率。本发明能挖掘出帖子内容相关的争论进行争议性检测,能够应对数据中存在的无关信息,能提高图神经网络的检测性能。
技术领域
本发明涉及社交媒体平台争议性检测领域,具体涉及一种基于动态子图生成方法挖掘关键局部争论进行争议性检测的方法。
背景技术
社交媒体平台已经成为了人们表达观点的重要平台。人们在社交媒体上进行分享、评论,并在部分帖子中引起了激烈的讨论,表明参与的人之间存在争议,这些有争议的帖子反映了公众的情感和关注点。根据Coletto et al.,2017[1],一个有争议的帖子具有可争议的内容,并且所表达的想法或观点会在回复中引起争论。帖子级别的争议性检测任务目标则是自动确定一个帖子是否具有争议性。该任务有助于评估人们观点的两极分化以及事件的影响力(Hessel and Lee,2019)[2],还为新闻主题选择提供参考。争议性检测在挖掘社交媒体公众情绪方面具有重要的作用,近年来已经成为人们的研究热点。
目前的争议性检测方法(Zhong et al.,2020)[3]首先通过“帖子-评论树”构建图结构,图中的节点代表帖子或者评论,边代表节点之间的回复关系。然后使用图卷积神经网络来学习图中节点的表示,并使用帖子和评论的平均信息来进行争议性检测。该方法无法利用节点相关的局部讨论进行节点表达的更新,并且无法对争论模式进行建模、无法关注到和帖子相关的信息。
在实际场景中,一个贴子的争议性往往体现在帖子的局部讨论(LocalDiscussion,简称LD)中,这些局部讨论是指和当前节点相关的讨论内容,在“帖子-评论树”图中具体表现为一个子图。有的局部讨论中存在争论,有的则没有,人们将那些存在争论的局部讨论称为局部争论(Local Argument)。而帖子中的讨论有的是和帖子相关的,有的则是离题的,人们将那些和帖子相关的局部争论称为关键局部争论(Key Local Argument,简称KLA)。存在关键局部争论的帖子很可能是有争议的帖子,因此寻找关键局部争论将有助于进行帖子的争议性检测。
图1展示了微博平台一个讨论“产假”和“陪产假”的争议性帖子以及评论的内容,评论内容的立场分为“支持”“反对”“中立”以及“无关”4个方面。图2展示的是图1帖子-评论的回复关系图,帖子中存在的部分局部讨论已由虚线圈标出,例如图中的LD1~LD3。在这些局部讨论中,LD2和LD3中存在争论,并且属于和帖子相关的讨论,因此LD2和LD3属于关键局部争论,即图中的KLA1和KLA2。基于图1和图2的观察,利用关键局部争论进行争议性检测可以分两步进行:(1)首先找出帖子中存在的局部讨论;(2)找出其中和帖子相关的,并最可能存在争论的局部讨论进行争议性检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110689802.8/2.html,转载请声明来源钻瓜专利网。