[发明专利]一种基于动态滑动窗口特征评分的谣言深度检测方法有效
申请号: | 201910095308.1 | 申请日: | 2019-01-31 |
公开(公告)号: | CN109918648B | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 许志伟;郭美城;刘利民;邢红梅 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/284;G06F40/30;G06F16/33;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 010080 内蒙古自治区呼*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 滑动 窗口 特征 评分 谣言 深度 检测 方法 | ||
本发明提供一种基于动态滑动窗口特征评分的谣言深度检测方法,该方法包括一种基于滑动窗口的特征提取机制,对输入语句的相邻词进行迭代,获取输入语句的显著全局和局部特征,准确地表示文本语义结构;该方法包括特征评分机制,根据输入语句矩阵各列的综合得分,删除与谣言检测几乎没有影响的特征相关的词列,保留关键特征相关的词列;该方法包括基于卷积神经网络的深度谣言检测模型,将动态滑动窗口评分机制得到的文本语义特征作为输入层的输入数据,经卷积计算,提取最大特征值,进行分类,最终提高了谣言检测的准确性。
技术领域
本发明属于大数据分析与应用技术领域,涉及在线谣言检测,特别涉及一种基于动态滑动窗口特征评分的谣言深度检测方法。
背景技术
随着移动互联网技术的快速发展,在线社交网络(OSN)—一种新的信息发布和共享服务平台,已逐渐成为人们日常生活中不可或缺的一部分。由于每个人都可以在OSN平台上自由发表意见与交流消息,这些社交网络平台通常会携带大量未经证实和不确定的信息,因此OSN平台成为了谣言传播的主要方式。谣言的广泛传播给OSN平台带来了网络安全的威胁。
除了潜在的安全问题,网络谣言从国家层面讲也会危害国家的安定团结,影响国家的繁荣和发展;从社会层面讲,搅乱社会秩序,影响人们的生产生活;从个人层面讲,影响未成年人的思维方式和对事物的认知态度。综合看,OSN平台在面对谣言时的脆弱性已经成为一个需要解决的严重社会问题。
然而,在现有的谣言检测方法中,有的需要手工标注特征,这样造成大量人力和时间上的浪费,而且存在主观因素的影响;有的忽略了文本语义特征,很难找到谣言的关键语义特征,从而区分谣言和常规信息;有的没有筛选并删除噪声特征,噪声特征作为深度神经网络模型的输入,将影响谣言检测方法的准确性。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于动态滑动窗口特征评分的谣言深度检测方法,大大提高了谣言检测的准确性,且计算开销小,易于实际部署。
为了实现上述目的,本发明采用的技术方案是:
一种基于动态滑动窗口特征评分的谣言深度检测方法,包括:
基于滑动窗口进行特征提取:对输入语句的相邻词进行迭代,获取输入语句的显著全局和局部特征,准确地表示文本语义结构;
特征评分:根据输入语句矩阵各列的综合得分,删除与谣言检测没有影响的特征相关的词列,保留关键特征相关的词列;
建立基于卷积神经网络的深度谣言检测模型,将得到的关键特征相关的词列作为输入层的输入数据,经卷积计算,提取最大特征值,进行分类,最终提高谣言检测的准确性。
所述特征提取的对象为包含不同长度单词的文本特征,通过对输入语句相邻词不同长度的迭代来捕获,从而找到输入语句的语义结构,并将其纳入谣言深度检测模型。
所述对输入语句相邻词不同长度的迭代来捕获的方法为:设定一定的窗口数目n,n等于最大句子长度,句子长度用单词数表示,通过不同大小的窗口框住不同长度的词,在窗口向后滑动的过程中,增量提取文本语义特征。
所述特征评分输入语句矩阵各列的综合得分的获取步骤如下:
步骤1)计算每个特征的TF-IDF值,筛选关键特征;
步骤2)应用卡方检验来查验关键特征与类别之间的相关性,所述类别包括谣言类和常规信息类;
步骤3)计算每列综合得分。
所述方法用于筛选在进行文本向量化表示过程中对检测贡献度较大的特征,并且与动态滑动窗口结合,能够在不破坏句子本身结构的前提下,从特征提取方面进一步改善了谣言深度检测的效率与准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910095308.1/2.html,转载请声明来源钻瓜专利网。