[发明专利]一种基于动态滑动窗口特征评分的谣言深度检测方法有效
申请号: | 201910095308.1 | 申请日: | 2019-01-31 |
公开(公告)号: | CN109918648B | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 许志伟;郭美城;刘利民;邢红梅 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/284;G06F40/30;G06F16/33;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 010080 内蒙古自治区呼*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 滑动 窗口 特征 评分 谣言 深度 检测 方法 | ||
1.一种基于动态滑动窗口特征评分的谣言深度检测方法,包括:
基于滑动窗口进行特征提取:对输入语句的相邻词进行迭代,获取输入语句的显著全局和局部特征,准确地表示文本语义结构;
特征评分:根据输入语句矩阵各列的综合得分,删除与谣言检测没有影响的特征相关的词列,保留关键特征相关的词列;
建立基于卷积神经网络的深度谣言检测模型,将得到的关键特征相关的词列作为输入层的输入数据,经卷积计算,提取最大特征值,进行分类,最终提高谣言检测的准确性;
其中所述特征评分中,输入语句矩阵各列的综合得分的获取步骤如下:
步骤11)计算每个特征的TF-IDF值,筛选关键特征;
步骤12)应用卡方检验来查验关键特征与类别之间的相关性,所述类别包括谣言信息类和常规信息类;
步骤13)计算每列综合得分;
其特征在于,所述步骤11)是利用TF-IDF值寻找文本中的关键特征,其是一种统计方法,用以评估一字词对于文本的重要程度,字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降,TF-IDF值的计算公式如下:
其中,是包含第i列特征的TF-IDF得分,是以i列为中心的k大小窗口的数目,k是窗口大小,是包含第i列特征的k大小的第j个特征的TF-IDF得分,n为窗口数目;
根据上述TF-IDF值的计算公式,增量的计算出每个特征的TF-IDF均值,利用均值筛选关键特征,特征的TF-IDF均值越大,表明该特征在文本中的重要程度越大,从而筛选出文本的关键特征;
所述步骤12)是利用卡方检验来检验关键特征与谣言信息类和常规信息类之间的相关性;卡方检验是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度决定卡方值的大小,值越大,实际观测值与理论推断值偏离程度越大,越不符合;值越小,实际观测值与理论推断值偏离程度越低,越符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合;检验公式如下:
其中,是包含第i列特征的卡方分数,是包含第i列特征的k大小的第j个特征的卡方分数,其计算公式如下:
其中Cregular是常规信息内容组,Crumor是谣言信息内容组,是包含i列的k大小第j个特征的单词,χ2表示卡方检验;
所述步骤13)中,第i列的综合得分Si通过以下公式得出:
Si=wt×STi+wx×SXi
其中,wt是STi(k)的权重,wx是的权重,wt和wx是根据基于梯度下降的算法的结果确定的,每列的综合得分越高,则与关键特征越相关,取得分高于设定阈值的词列,作为关键特征相关的词列。
2.根据权利要求1所述基于动态滑动窗口特征评分的谣言深度检测方法,其特征在于,所述特征提取的对象为包含不同长度单词的文本特征,通过对输入语句相邻词不同长度的迭代来捕获,从而找到输入语句的语义结构。
3.根据权利要求2所述基于动态滑动窗口特征评分的谣言深度检测方法,其特征在于,所述对输入语句相邻词不同长度的迭代来捕获的方法为:设定一定的窗口数目n,n等于最大句子长度,句子长度用单词数表示,通过不同大小的窗口框住不同长度的词,在窗口向后滑动的过程中,增量提取文本语义特征。
4.根据权利要求1所述基于动态滑动窗口特征评分的谣言深度检测方法,其特征在于,所述基于卷积神经网络的深度谣言检测模型中进行如下处理:
步骤21)在输入层输入关键特征相关的词列;
步骤22)在卷积层进行卷积运算,得到特征映射;
步骤23)在池化层提取最大特征值;
步骤24)在Softmax层进行一维向量全连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910095308.1/1.html,转载请声明来源钻瓜专利网。