[发明专利]一种基于大数据的舆情聆听系统有效
申请号: | 201910545264.8 | 申请日: | 2019-06-21 |
公开(公告)号: | CN110263238B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 孟宪坤;张蕾;刘杰 | 申请(专利权)人: | 浙江华坤道威数据科技有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F40/205;G06F40/284 |
代理公司: | 杭州信义达专利代理事务所(普通合伙) 33305 | 代理人: | 施建勇 |
地址: | 310000 浙江省杭州市余杭区余杭街道*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 舆情 聆听 系统 | ||
1.一种基于大数据的舆情聆听系统,其特征在于,包括:
信息采集单元(1):在大数据的基础上,采用技术手段进行舆情信息的采集,将预设的主题词,从网络平台上筛选出包含主题词的网络页面文本数据;
信息爬取单元(2):连接信息采集单元(1),对包含主题词的网络页面文本数据进行分析,使用已有的网络爬虫技术,通过分词技术对网络页面文本数据进行分词处理,获得多个词组;并根据多个网络页面中出现的该词组的频率,将出现频率高的词组确定为与主题词相关联的关键词;
噪声过滤单元(3):连接信息采集单元(1)并接收从信息采集单元(1)传输过来的关键词的集合信息和主题词的词频,并对关键词进行去噪;
权重分配单元(4),连接噪声过滤单元(3)并接收从噪声过滤单元(3)传输过来的关键词的集合信息和主题词的词频;根据主题词出现的频率,确定舆情的级别,筛选出成长期的舆情和成熟期的舆情,作为后续监控和分析的“凸显舆情”;同时,根据关键词出现的频率,确定“凸显舆情”的性质;
舆情分析单元(5),连接权重分配单元(4),实时接收权重分配单元(4)发送过来的舆情值、关键词的集合信息和主题词的词频;针对成长期和成熟期的舆情的现状进行风险评估,分析主题词和关键词随时间变化的热度,确定舆情的发展脉络,还原事态的发展,并对未来发展态势进行趋势预测,及时发出舆情风险评估;
报警与应对单元(6),连接舆情分析单元(5)和信息采集单元(1),针对“凸显舆情”,通过消息推送,将舆情分析内容反馈给客户,还原事态的发展,展现对于该事件的舆情的最主要的关切点,建议采用的应对措施;
其中,所述权重分配单元(4)中,舆情的级别,分为:
1.孵化期:舆情的热度较低,尚未形成规模化的讨论,影响范围仅局限在小范围内,但是有转换为热点舆情的可能;
设定阈值N;阈值N为经验常数;当舆情的主题词出现的频率接近于N时,表示该舆情时间为热点舆情;
孵化期的主题词出现的频率<N/5;
2.成长期:舆情的热度中等,但是成长速度和传播速度较高,影响到的范围越来越广;N/5≤成长期的主题词出现的频率<4N/5;
3.成熟期:舆情的关注度炙热,影响范围非常广,基本上各个平台都有讨论;成熟期的主题词出现的频率≥4N/5;
4.衰退期:舆情的热度逐步衰减;孵化期、成长期和成熟期都有可能直接进入衰退期。
2.如权利要求1所述的一种基于大数据的舆情聆听系统,其特征在于,所述信息采集单元(1)中的大数据涵盖了传统媒体、微博、微信、各类媒体分发平台、网络讨论区论坛。
3.如权利要求1所述的一种基于大数据的舆情聆听系统,其特征在于,对针对“凸显舆情”进行研判,是指针对“凸显舆情”中不同的关键词,给予不同的权重:
S1,权重分配单元(4)内设语义分析模块,比对“凸显舆情”关键词,确定关键词类型;关键词类型包括:
1).是事实陈述的关键词;事实陈述的关键词,隶属于以下领域:舆情来源、采集时间、涉及类别、事件名称、事发地点、涉及单位、伤亡人数、发生时间、基本情况、报告人、报告时间;事实陈述的关键词,仅作为还原事件经过的关键词;
2).语气倾向的关键词,可分为褒义词、中性词和贬义词;语气倾向的关键词,作为舆情事件的定性内容;
S2,根据关键词的类型、出现热度、倾向,赋予该关键词舆情值;舆情本身是一种矢量,其基本指标包括热度、倾向;
重点分析语气倾向的关键词;已知该类关键词T的词频Tf,表示其热度;关键词T的词性Tx,表示倾向;正面的积极的关键词T词性Tx为大于1的正数,负面的关键词T性Tx为小于-1的负数,中性的关键词T性Tx为0;词性Tx由系统预设,人为可调整其具体的数值;Tx的绝对值位于[1,3];
其中,A为舆情值,Tif表示第i个关键词的词频,Tix表示第i个关键词的词性,N表示包含主题词的网络页面总数量;
当舆情值A小于报警阈值-B,则表示该舆情事件为负面事件,需要紧急处理;其中,B为大于0的经验常数;
当舆情值A大于报警阈值B,则表示该舆情事件为正面事件;其中,B为大于0的经验常数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江华坤道威数据科技有限公司,未经浙江华坤道威数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910545264.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置