[发明专利]虚假网络舆情识别方法在审
申请号: | 201810451684.5 | 申请日: | 2018-05-12 |
公开(公告)号: | CN108563798A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 赵乔 | 申请(专利权)人: | 苏州华必讯信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 215300 江苏省苏州市昆山市玉*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种虚假网络舆情识别方法,用于解决现有的互联网虚假网络舆情识别方法需要处理大量网络信息的技术问题。技术方案是首先采用行为分析技术,对网络论坛信息传播行为进行建模分析,检测出网络热点事件和舆情。然后依据网络水军行为特征,对网络舆情进行多个层面关联性分析,包括空间关联性、时间关联性、主题关联性以及情感关联性等,识别出可能存在的虚假网络舆情。将所处理的网络信息量减少到了最低限度。 | ||
搜索关键词: | 网络舆情识别 网络舆情 关联性 关联性分析 空间关联性 时间关联性 信息量减少 建模分析 网络论坛 网络热点 网络信息 信息传播 行为分析 行为特征 网络 互联网 检测 | ||
【主权项】:
1.一种虚假网络舆情识别方法,其特征在于包括以下步骤:步骤一、利用网络数据采集工具,从互联网中需要监测的网络论坛上采集网络发帖信息、发帖用户信息、帖子内容、回帖用户信息以及回帖内容,提取其中的元信息,网络信息经过预处理后存入数据库待分析;步骤二、对于每个被监测的网络论坛,按下列方法检测是否存在网络舆情或热点事件;以用户为节点,用户之间的联系为节点之间的连线,建立用户-用户网络模型;通过用户-用户之间的联系形成有向网络,在一个带值的有向网络中,一个节点的威望度是指这个节点的入度与所有节点的入度和的比值,威望度计算公式如下:式中,xi‑表示节点vi入度;入度是指所有指向该节点的所有连线上数值之和;在一个带值的有向网络中,一个节点的中心度是指这个节点的出度与所有节点的出度和的比值;中心度计算公式如下:式中,xi+表示节点vi的出度;出度是指所有指向其他结点的所有连线上数值之和;建立用户-事件网络模型,通过用户与事件之间的联系形成无向网络;事件的中心度是指参与该事件的人数与总人数个数的比值;事件的中心度计算公式如下:式中,xi表示参与事件ei的用户,m表示该用户-事件网络模型中总的用户个数;将用户从网络中剥离出来,建立事件-事件网络模型,计算出事件之间的关联度;利用用户-用户网络模型计算出节点的威望度和中心度,检测出威望度和中心度值大的用户,利用用户-事件网络模型计算出事件中心度,检测出中心度值大的事件;将用户-事件网络模型转换成事件-事件网络模型,计算出帖子之间的关联度,找出属于同一个主题的帖子,判断是否网络水军发的帖子;步骤三、根据网络水军发帖行为和帖子特征,对不同网络论坛出现的网络舆情或热点事件进行多层面分析,识别出可能存在的虚假网络舆情;(1)对每一个ID账号发帖时所使用的IP地址进行统计分析,计算出同一个IP地址的帖子量;通过空间关联性分析,检测出不同网络论坛上热点事件帖子的ID账号与 IP地址之间关联性,计算它们的空间关联度;(2)通过时间关联性分析,检测出不同网络论坛上热帖的时间关联性,计算它们的时间关联度;(3)通过主题内容语义分析,检测出不同网络论坛上热帖的主题关联性,计算它们的主题关联度;(4)通过对不同网络论坛上热帖所表达的情感进行多层次分析,包括词汇、句子和文档,检测出不同网络论坛上热帖的情感关联性,计算它们的情感关联度;(5)根据对所有网络热点事件的关联性分析结果,如果一个网络热点事件同时具有上述四个关联度,则该网络热点事件为虚假网络舆情;如果一个网络热点事件同时具有上述三个关联度,则该网络热点事件为高度疑似虚假网络舆情;如果一个网络热点事件同时具有上述二个关联度,则该网络热点事件为一般疑似虚假网络舆情。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州华必讯信息科技有限公司,未经苏州华必讯信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810451684.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种网页内容有分页的抓取方法
- 下一篇:一种动态生成舆情简报的方法