[发明专利]一种多维度舆情危机预测方法、终端设备及存储介质有效
申请号: | 201911230765.3 | 申请日: | 2019-12-05 |
公开(公告)号: | CN111026868B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 陈佳锋;栾江霞;章正道;王仁斌;陈镇国;江明臻 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36;G06Q10/04;G06Q50/00 |
代理公司: | 厦门市精诚新创知识产权代理有限公司 35218 | 代理人: | 何家富 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多维 舆情 危机 预测 方法 终端设备 存储 介质 | ||
本发明涉及一种多维度舆情危机预测方法、终端设备及存储介质,在该方法中包括:S1:采集一定时间内的舆情文本数据,并根据每个文本数据在不同维度的属性计算其负面情感热度总指数;S2:根据舆情危机知识库中存储的各类型舆情危机事件,通过聚类算法对文本数据进行分类,并计算每个文本数据与其聚类中心的相关度;S3:根据每个文本数据与其聚类中心的相关度和该文本数据的负面情感热度总指数计算每个文本数据的危机程度。本发明通过不同维度的属性计算负面情感热度总指数,并与历史的各类型舆情危机事件进行聚类,得到每个文本数据的危机程度,实现对重大负面舆情的预测,可以提高舆情预测的准确性和时效性。
技术领域
本发明涉及舆情分析领域,尤其涉及一种多维度舆情危机预测方法、终端设备及存储介质。
背景技术
网络舆情是通过互联网传播的公众对现实生活中某些问题所持有的较强影响力、倾向性的观点和言论,主要通过新闻评论、论坛贴文、博客、微博等媒体实现,集中反映了一个时间段内的网络舆论。
在现有的情感分析算法中错误率还是较高的,较为常用的snowNLP算法也存在一定的误差,常见的方法有通过基于一组手动制定的规则执行情感分析计算,有通过依靠机器学习技术从数据中学习执行情感分析计算,但这些方法都存在一些弊端,由于缺乏背景知识,上下文联系,从而导致数据准确性不高,召回率低,情感分析指数在时间序列上无法直观体现。虽然在增加更多规则和样本库进行训练可以做一些改进以提高准确性和召回率,但往往还是无法两者兼顾。
多维度舆情危机预测时效性敏感,随着时间的推移,舆情危机爆发的可能也随之增加,在时间维度上的特点往往也需要纳入情感分析范围,低维度的情感分析也导致多维度舆情危机预测难以成型,难以达到较理想的效果。
发明内容
针对上述问题,本发明旨在提供一种多维度舆情危机预测方法、终端设备及存储介质。
具体方案如下:
一种多维度舆情危机预测方法,包括以下步骤:
S1:采集一定时间内的舆情文本数据,并根据每个文本数据在不同维度的属性计算其负面情感热度总指数;
S2:根据舆情危机知识库中存储的各类型舆情危机事件,通过聚类算法对文本数据进行分类,并计算每个文本数据与其聚类中心的相关度;
S3:根据每个文本数据与其聚类中心的相关度和该文本数据的负面情感热度总指数计算每个文本数据的危机程度。
进一步的,每个文本数据的负面情感热度总指数的计算过程包括以下步骤:
S11:设定文本数据的多个情感属性、每个情感属性对应的情感系数、多个热度属性和每个热度属性对应的热度系数;
S12:根据下式计算该文本数据的负面情感值和热度值;
Ai=f(si,ri)
Bj=h(1-ej,qj)
其中,Ai表示第i个热度属性的热度值,f表示热度值计算函数,si表示第i个热度属性,ri表示第i个热度属性对应的热度系数,Bj表示第j个情感属性的负面情感值,h表示负面情感值计算函数,ej表示第j个情感属性,qj表示第j个情感属性对应的情感系数;
S13:根据下式计算该文本数据的负面情感热度指数W:
W=A+B
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911230765.3/2.html,转载请声明来源钻瓜专利网。