[发明专利]基于风格引导的双线性神经网络虚假新闻检测方法及系统有效
申请号: | 201910341056.6 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110210016B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 曹娟;王佳臣;谢添;李锦涛;郭俊波 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/30;G06N3/04;G06N20/00 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 风格 引导 双线 神经网络 虚假 新闻 检测 方法 系统 | ||
1.一种基于风格引导的双线性神经网络虚假新闻检测方法,其特征在于,包括:
步骤1、获取待网络虚假新闻检测的新闻文本,通过神经网络量化该新闻文本的语言风格特征,得到该新闻文本的风格向量,将该新闻文本输入文本特征提取器,得到该新闻文本的文本向量;其中,该语言风格特征包括该新闻文本的可读性、可信度、交互性、轰动性、逻辑性、规范性、有趣度和结构完整性;
步骤2、将该风格向量和该文本向量输入双线性神经网络,该双线性神经网络包括双线性函数,用于建模该风格向量和该文本向量之间的相关性,以得到该新闻文本的的风格-文本特征矩阵,使用该风格-文本特征矩阵中最大分数向量组成引导向量,并将该引导向量输入至全连接层,判定该新闻文本的虚假新闻标签。
2.如权利要求1所述的基于风格引导的双线性神经网络虚假新闻检测方法,其特征在于,该步骤1包括:
步骤11、将该新闻文本转化为词汇向量拼接而成的向量矩阵其中⊕表示拼接操作,xi表示该新闻文本中第i个词所对应的词汇向量,i为大于2且小于n的正整数,x1:n表示长度为n的该向量矩阵;
步骤12、该文本特征提取器为长短期记忆网络,该向量矩阵输入至该长短期记忆网络,得到该向量矩阵中每一个词汇向量的隐状态ht=H(ht-1,xt),t小于等于n,ht为第t个词汇向量的隐状态;
步骤13、通过注意力机制来为每一个隐状态分配权重ui=tanh(Wwhi+bw),其中Ww表示权重矩阵,bw表示偏置,αi为经过归一化后第i个隐状态的权重;
步骤14、通过加权求和该权重αi和该隐状态ht,得到该文本向量ft为该文本向量。
3.如权利要求1所述的基于风格引导的双线性神经网络虚假新闻检测方法,其特征在于,得到该风格-文本特征矩阵的方法如下:
fs为该风格向量,ft为该文本向量,B为该双线性函数,fb为该风格-文本特征矩阵。
4.如权利要求1所述的基于风格引导的双线性神经网络虚假新闻检测方法,其特征在于,该文本特征提取器为长短期记忆网络或双向长短期记忆网络。
5.如权利要求1所述的基于风格引导的双线性神经网络虚假新闻检测方法,其特征在于,步骤2包括:使用最大池化函数筛选出该风格-文本特征矩阵中最大分数向量组成引导向量。
6.一种基于风格引导的双线性神经网络虚假新闻检测系统,其特征在于,包括:
模块1、获取待网络虚假新闻检测的新闻文本,通过神经网络量化该新闻文本的语言风格特征,得到该新闻文本的风格向量,将该新闻文本输入文本特征提取器,得到该新闻文本的文本向量;其中,该语言风格特征包括该新闻文本的可读性、可信度、交互性、轰动性、逻辑性、规范性、有趣度和结构完整性;
模块2、将该风格向量和该文本向量输入双线性神经网络,该双线性神经网络包括双线性函数,用于建模该风格向量和该文本向量之间的相关性,以得到该新闻文本的的风格-文本特征矩阵,使用该风格-文本特征矩阵中最大分数向量组成引导向量,并将该引导向量输入至全连接层,判定该新闻文本的虚假新闻标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910341056.6/1.html,转载请声明来源钻瓜专利网。