[发明专利]一种基于新闻-评论关联性分析的虚假新闻识别方法在审
申请号: | 202010420460.5 | 申请日: | 2020-05-18 |
公开(公告)号: | CN111639252A | 公开(公告)日: | 2020-09-08 |
发明(设计)人: | 李玉华;张文杰;李瑞轩;辜希武 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/33;G06F40/284;G06N3/04 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 尹丽媛;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 新闻 评论 关联性 分析 虚假 识别 方法 | ||
1.一种基于新闻-评论关联性分析的虚假新闻识别方法,其特征在于,包括:
S1、基于待识别新闻内容构建其新闻特征矩阵,以及基于待识别新闻的每条评论的内容构建该条评论的特征向量;同时根据评论间回复关系,将每条初始评论作为根节点、每条回复评论作为子节点构建多个评论树;
S2、将每个评论树中每个节点的所述特征向量与其父节点的上下文关联特征向量相关联,通过递归计算得到该评论树所有叶子节点的上下文关联特征向量并进行加权计算,得到该评论树的特征向量;
S3、匹配所述新闻特征矩阵与所有评论树的特征向量之间的关联性,得到考虑评论的新闻子句间注意力权重,用于对所述新闻特征矩阵中各文本子句对应的向量之间进行加权得到新闻特征向量,以及得到考虑新闻的评论树间注意力权重,用于对各评论树的特征向量之间进行加权得到评论特征向量,基于新闻特征向量和评论特征向量判断新闻的真实性。
2.根据权利要求1所述的一种基于新闻-评论关联性分析的虚假新闻识别方法,其特征在于,所述新闻特征矩阵的构建方法具体为:
获取待识别新闻的文本内容并对其分句分词,将分词后的单词进行词向量转换;采用循环神经网络将所有所述词向量转换为关联上下文信息的隐状态向量;采用注意力机制,对所述分句得到的每个子句所对应的所有所述隐状态向量进行加权,将该子句表示为一维特征向量,所有子句的特征向量构成待识别新闻的二维新闻特征矩阵。
3.根据权利要求2所述的一种基于新闻-评论关联性分析的虚假新闻识别方法,其特征在于,所述根据待识别新闻的每条评论的内容构建该条评论的一维特征向量,具体为:
获取每条评论的文本内容并对其分词,将分词后的单词进行词向量转换;采用循环神经网络将所有所述词向量转换为关联上下文信息的隐状态向量;采用注意力机制,对所有所述隐状态向量进行加权,将该条评论表示成一维特征向量。
4.根据权利要求3所述的一种基于新闻-评论关联性分析的虚假新闻识别方法,其特征在于,所述S1中的所有所述循环神经网络为双向长短期记忆网络。
5.根据权利要求1至4任一项所述的一种基于新闻-评论关联性分析的虚假新闻识别方法,其特征在于,所述S2中,采用门循环单元通过递归计算,得到所述所有叶子节点的上下文关联特征向量。
6.根据权利要求5所述的一种基于新闻-评论关联性分析的虚假新闻识别方法,其特征在于,所述S2中,每个评论树的特征向量构建方法为:
基于门循环单元,对每个评论树自顶向下,将当前节点的所述特征向量与其父节点的隐状态向量相结合,计算该节点的用于保留父节点部分隐状态信息的重置门控以及用于调节父节点隐状态信息保留比例的更新门控,通过递归处理,计算出该评论树中所有节点的隐状态向量;使用池化方法处理该评论树所有叶子节点的隐状态向量,得到该评论树的特征向量。
7.根据权利要求6所述的一种基于新闻-评论关联性分析的虚假新闻识别方法,其特征在于,所述重置门控ri计算公式为:ri=σ(Wrci+Urhp(i)),所述更新门控zi计算公式为:zi=σ(Wzci+Uzhp(i)),式中,Wr、Wz均为参数矩阵,Ur、Uz均为参数向量,σ为激活函数,hp(i)为第i个节点的父节点隐状态向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010420460.5/1.html,转载请声明来源钻瓜专利网。