[发明专利]一种基于特征融合模型的虚假新闻检测方法在审
申请号: | 202210105328.4 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114462420A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 周晓峰;张雨臣 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 颜盈静 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 融合 模型 虚假 新闻 检测 方法 | ||
1.一种基于特征融合模型的虚假新闻检测方法,其特征在于:包括以下步骤:
步骤1:获取待检测的新闻数据,所述新闻数据包括新闻文本以及新闻标题;
步骤2:将获取到的新闻数据进行预处理,依次包括分词操作、去停用词操作和文本向量化表示,最终得到文本向量;
步骤3:将步骤2得到的文本向量输入至局部语义子网络模型中,得到新闻文本局部语义特征;
步骤4:将步骤2得到的文本向量输入至上下文语义子网络模型中,得到新闻文本上下文语义特征;
步骤5:采用TF-IDF算法提取新闻标题的关键词,获取新闻标题的关键词特征;
步骤6:将新闻文本局部语义特征、新闻文本上下文语义特征以及新闻标题的关键词特征进行融合,得到待检测的新闻数据的融合文本表示;
步骤7:将融合文本表示输入至分类器中对待检测的新闻数据进行分类,得到检测结果。
2.根据权利要求1所述的一种基于特征融合模型的虚假新闻检测方法,其特征在于:步骤2中,采用结巴分词工具以及停用词表分别完成对待检测的新闻数据的分词操作和去停用词操作。
3.根据权利要求1所述的一种基于特征融合模型的虚假新闻检测方法,其特征在于:步骤2中,采用word2vec模型对经分词操作和去停用词操作后的文本进行文本向量化表示。
4.根据权利要求1所述的一种基于特征融合模型的虚假新闻检测方法,其特征在于:所述局部语义子网络模型为CNN模型。
5.根据权利要求4所述的一种基于特征融合模型的虚假新闻检测方法,其特征在于:所述CNN模型包括卷积层和池化层;在卷积层中,使用卷积核对文本向量进行卷积操作;将卷积操作结果输入至池化层,提取所有局部特征的平均值代替所有的局部特征,得到新闻文本局部语义特征。
6.根据权利要求5所述的一种基于特征融合模型的虚假新闻检测方法,其特征在于:卷积层使用大小为r×d的滤波器对句子矩阵进行卷积操作来完成特征的提取工作,表示为:
ci=f(W×xi:i+r-1+b) (1)
其中,W为卷积核,r表示卷积核的大小,d表示词嵌入的维度,b表示偏置量,xi:i+r-1表示从i到i+r-1个词组成的句子向量,f表示通过ReLU进行非线性操作的函数;
经过卷积操作之后最终得到一个n-r+1维的局部特征矩阵C:
C={c1,c2,...cn-r+1} (2)。
7.根据权利要求1所述的一种基于特征融合模型的虚假新闻检测方法,其特征在于:所述上下文语义子网络模型为引入注意力机制的双向长短时记忆神经网络。
8.根据权利要求7所述的一种基于特征融合模型的虚假新闻检测方法,其特征在于:所述引入注意力机制的双向长短时记忆神经网络包括BiLSTM模型和Attention层;
t时刻,BiLSTM的隐藏状态包括前向的和后向的分别表示为:
前向的和后向的合并,实现文本数据的前向特征和后向特征的提取,表示为:
在Attention层中执行以下步骤:
记BiLSTM提取的特征向量集合H,表示为[h1,h2,...hT],其中H∈Rd×T,d为词向量的维度,T为文本的长度;通过以下公式得到权重矩阵:
M=tanh(H) (12)
α=soft max(wTM) (13)
r=HαT (14)
其中,w是维度为d的训练的参数向量,wT为训练学习得到的参数向量的转置矩阵,之后进行向量的加权得到新闻文本上下文语义特征表示h*:
h*=tanh(r) (15)。
9.根据权利要求1所述的一种基于特征融合模型的虚假新闻检测方法,其特征在于:步骤5中,所述TF-IDF算法表示为:
TF-IDF=TF·IDF (18)
其中:
式中,ni,j表示关键词ti在新闻标题dj中出现的次数,TFi,j表示关键词ti在新闻标题dj中出现的频率;|D|表示所有新闻标题的数量,|j:ti∈dj|表示包含关键词ti的标题数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210105328.4/1.html,转载请声明来源钻瓜专利网。