[发明专利]一种网络舆论趋势预测分析方法在审
申请号: | 201710633501.7 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107391712A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 王亚迪;岳小玲 | 申请(专利权)人: | 王亚迪;岳小玲 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京创遇知识产权代理有限公司11577 | 代理人: | 朱红涛,李芙蓉 |
地址: | 473000 河南省南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 舆论 趋势 预测 分析 方法 | ||
技术领域
本发明涉及网络舆论技术领域,具体涉及一种网络舆论趋势预测分析方法。
背景技术
网络已经成为影响社会秩序、组织利益和个人声誉的重要媒介。通过对网络舆情进行监测,及时发现可能影响社会发展、组织利益和个人声誉的舆情事件,并提早应对,已经成为各级组织单位和个人必须面对的事情。
公开号为CN105608200A的中国专利文献公开了一种网络舆论趋势预测分析方法,包括以下步骤,步骤S101:确定指标体系,爬取网络舆论信息,通过预处理获得所需指标的时间序列;步骤S102:建立模型,在获取得到的时间序列上建立候选模型;步骤S103:选取最优模型,从建立的候选模型中比较选取最优模型;步骤S104:网络舆论趋势预测分析,基于选择的最优模型对网络舆论趋势进行预测分析。采用上述方法后,该专利滞后参数的可调性能够灵活的适应实际需求,同时引入MVE来作为模型选择的判断标准,提高了对特定舆情发展趋势波动的预测能力。最终,可通过新的数据对模型进行修正,为长期追踪预测创造了可能。但是该专利忽略了舆论内涵的变化,从而无法根据内涵对模型进行修正。
文献“基于主题分类的网络舆情观测指数体系研究,情报杂志,2012,高承实等”将难以观测的基于事件的网络舆情预警监控转换为易于观测的基于不同主题分类上的网络舆情监控+定义了网络舆情影响指数、网络舆情趋势指数和网络舆情积聚指数3个指数,分别给出了各指数的具体含义和计算办法,最后对各种指数的综合运用进行了讨论。但是该文献仅是说明了指数获取和影响,并未真正告知如何进行舆论趋势的预测。
发明内容
本发明的目的在于提供一种网络舆论趋势预测分析方法,本发明提供的网络舆论趋势预测分析方法,能够根据关键词进行筛选舆论,并根据舆论热度的增长进行预测舆论趋势,从而更好地监管舆论。
为实现上述目的,本发明提供一种网络舆论趋势预测分析方法,该方法包括:
建立关键词数据库;
获取网络舆论,该网络舆论含有所述关键词数据库中的关键词;
获取所述网络舆论的舆论热度曲线;
对该舆论热度曲线进行作二阶导数。
可选的,所述关键词数据库包括第一敏感词子库和否定词子库以及第二敏感词子库和肯定词子库;所述网络舆论同时包括所述第一敏感词子库和否定词子库中的关键词和/或同时包括所述第二敏感词子库和肯定词子库中的关键词。
可选的,所述获取所述网络舆论的舆论热度曲线的获取步骤包括:采用马尔科夫模型进行获取所述舆论热度曲线;其中,所述舆论热度曲线的横坐标为时间,纵坐标为转发次数、阅读次数和评论次数之和。
可选的,所述舆论热度曲线为离散曲线,间隔时间为1秒,相邻离散曲线之间采用直线相连。
可选的,在所述对该舆论热度曲线进行作二阶导数步骤之后,所述方法还包括:若该二阶导数在连续的时间段t内均大于数值M,则判定该网络舆论为热门舆论。
可选的,所述M为零。
可选的,在所述若该二阶导数在连续的时间段t内均大于数值M,则判定该网络舆论为热门舆论的步骤之后,所述方法还包括:将所述网络舆论转到人工分析并进行判断是否要禁止。
本发明具有如下优点:
本发明先建立关键词数据库,然后根据该数据库中的关键词进行网络舆论的筛分和追踪,并对含有有所述关键词数据库中的关键词的网络舆论的热度进行作舆论热度曲线,并根据舆论热度的增长进行预测舆论趋势,从而更好地监管舆论。
附图说明
图1是本发明提供的方法一示例性实施例的流程示意图。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
图1是本发明提供的方法一示例性实施例的流程示意图。如图1所示,该方法包括如下步骤。
步骤100:建立关键词数据库。所述关键词数据库可以为一些色情、反党反社会以及具有煽动性的词语,例如,台湾,回归,色情,裸体等等。除了直接能够辨别禁止含义的词语外,有些词语必须得与其它词语结合,例如热爱祖国,与憎恨祖国,意思完全相反,但是二者中的词语均非能够直接禁止的词语,因此,所述关键词数据库可以包括第一敏感词子库和否定词子库以及第二敏感词子库和肯定词子库;所述网络舆论同时可以包括所述第一敏感词子库和否定词子库中的关键词和/或同时包括所述第二敏感词子库和肯定词子库中的关键词,在此状况下,例如含有憎恨祖国等词语的网络舆论即可被发现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王亚迪;岳小玲,未经王亚迪;岳小玲许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710633501.7/2.html,转载请声明来源钻瓜专利网。