[发明专利]基于灰色关联分析的网络舆情热度值定量识别方法在审
申请号: | 201911083331.5 | 申请日: | 2019-11-07 |
公开(公告)号: | CN111414550A | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 陶磊;屈立笳;彭光辉;苟溟 | 申请(专利权)人: | 成都国腾实业集团有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/958 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610041 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 灰色 关联 分析 网络 舆情 热度 定量 识别 方法 | ||
本发明提出了基于灰色关联分析的网络舆情热度值定量识别方法,通过设定网络舆情热点事件评价指标体系,结合灰色关联分析方法,对网络舆情热点事件的热度值进行定量分析,并获得事件持续时间段内网络舆情热点事件的热度值排序,方便用户根据热度值把握事件热点,并优化应对策略,且能根据热度值验证网络舆情热点事件评价指标体系设定是否合理,从而为多指标体系下的热点事件研究和分析提供更优的网络舆情热点事件定量评价指标体系,实现最优的热点数据获取和多个相关事件的热度值识别。
技术领域
本发明涉及网络舆情热点识别技术领域,尤其涉及基于灰色关联分析的网络舆情热度值 定量识别方法。
背景技术
网络舆情热点的研究目前主要集中在两个方向:一是研究网络舆情热点的形成条件、演 化规律,并构建热度评价指标体系,提出应对策略等;二是基于某种算法或者模型,实现对 网络舆情热点的抓取和分析,并逐渐向着计算机自动发现与预测的方向发展;但是,第一个 方向目前需要大量的数据做支撑,且需要复杂的人工分析,而第二个方向对网络舆情热点的 分析研究缺乏热度评价指标体系,往往根据算法或模型从大量数据中寻找符合热点事件必要 支撑数据,而各算法或模型在对热点进行抓取和分析时存在的误差较大,不能对各算法或模 型的正确性进行验证。
发明内容
本发明的目的在于,针对上述问题,提出基于灰色关联分析的网络舆情热度值定量识别 方法,通过建立网络舆情热度评判指标体系,利用灰色关联分析来获得某时间段内集中出现 的网络舆情热点事件的热度值排序,以供用户把握主次,根据热度值分级应对。
基于灰色关联分析的网络舆情热度值定量识别方法,包括以下步骤:
S1:建立多个相关事件的网络舆情热度评判指标;
S2:对多个相关事件的评判指标进行全网采集,得到比较数列原始数据;
S3:根据比较数列原始数据确定参考数列原始数据;
S4:对比较数列和参考数列原始数据进行无量纲化处理;
S5:计算比较数列与参考数列的灰色关联系数;
S6:根据灰色关联系数计算关联度;
S7:对关联度排序得到关联序,并以关联序表征相关事件网络舆情热度值排序。
优选的,所述网络舆情热度评判指标为包括搜索指数、舆情关注度、网民相关言论数量、 网络媒体图文报道数量以及事件平均持续时间的定量指标。
优选的,所述搜索指数为被搜索引擎检索的关键词在事件平均持续时间内的网络曝光率 及用户关注度;所述事件平均持续时间为相关事件从开始引发网络舆情到基本平息所持续的 时间。
优选的,所述网民相关言论数量为知名社交平台上网民对相关事件发表的言论数量;所 述网络媒体图文报道数量为各媒体平台上网络媒体对相关事件发表的原创或转载的新闻报道 数量。
优选的,所述舆情关注度以相关事件主题下相关网页的数量表示。
优选的,比较数列和参考数列分别指影响系统行为的因素组成的若干组数据序列和反映 系统行为特征的数据序列;所述数据序列中影响系统行为的因素包括根据网络舆情热度评判 指标进行全网采集得到的原始指标数据,所述原始指标数据组成比较数列原始数据,所述参 考数列原始数据由比较数列原始数据中每组数据序列的最大值组成。
优选的,所述步骤S4中采用极值法、标准化、均值化或初值化方法对对参考数列和比较 数列的原始数据进行无量纲化处理。
优选的,所述灰色关联系数为比较数列与参考数列的关联程度值。
优选的,所述关联度为用来衡量比较数列与参考数列之间的关联程度的关联系数的平均 值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都国腾实业集团有限公司,未经成都国腾实业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911083331.5/2.html,转载请声明来源钻瓜专利网。