[发明专利]一种网络舆情的热点预测和分析方法无效
申请号: | 200910214401.6 | 申请日: | 2009-12-30 |
公开(公告)号: | CN101763401A | 公开(公告)日: | 2010-06-30 |
发明(设计)人: | 姚国祥;罗伟其;官全龙;宋嘎子;陈凤其 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈燕娴 |
地址: | 510632 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 舆情 热点 预测 分析 方法 | ||
技术领域
本发明涉及网络信息安全领域,更具体的说是一种网络舆情的热点预测和 分析方法。
背景技术
舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化, 民众对社会管理者产生和持有的社会政治态度。它是较多群众关于社会中各种 现象、问题所表达的信念、态度、意见和情绪等等表现的总和。
网络舆情是社会舆情在互联网空间的映射,是社会舆情的直接反映。随着 网络的迅速发展,网络舆情已经成为反映社会舆情的主要表现形式。网络舆情 借助网络的众多特点表现出了以下几个特点:
1)参与广泛性。网络的迅速普及使得网络言论更为方便,身份的隐蔽使得 言论更为广泛和自由。参与人数众多,参与人数复杂,导致网络舆论引起的社 会事件越来越具有群体性。
2)存在多样化。网络舆情主要载体有:新闻评论、BBS、博客、社区网站、 群体聊天室等。随着WEB技术的不断更新,传播方式更加多样化。
3)传播迅速,具有很强的突发性。舆情借助网络信息的快速发布,在较短 时间内形成舆情热点,进而反映社会现实或者事件,具有突发性特点。
中国互联网信息中心2009年7月发布的最新报告中说明:“中国网民规模 达到3.38亿人,普及率达到25.5%。网民规模较2008年底年增长4000万人, 半年增长率为13.4%,中国网民规模依然保持快速增长之势”。同时也说明了网 络舆情会越来越多地影响社会,特别是热点舆情可能是社会问题的反应。从网 络安全与社会和谐建设角度出发,网络舆情的监控,特别是热点舆情预测和分 析,是未来舆情领域研究的重点。
目前网络热点舆情的分析方法主要有以下几类:
一是:通过对抓取的舆情信息聚类分析,从分析类别的内容和数量上阐述 舆情热点。如中国专利公开号为CN101414300A的发明专利申请将舆情信息分 类、中文信息处理,得到向量化的分类特征,在后来的分析中利用特征来匹配 舆情内容。
二是:通过获取舆情信息的参与人数、信息回帖的时间分布特点等舆情信 息的数字表现形式上预测热点、分析热点。如中国专利公开号为CN101394311A 的发明专利申请中根据舆情热点形成的时间序列特点,建立时间序列预测模型, 进而对可能出现的热点舆情进行分析预测。
三是:从热点舆情的形成、发展流程上分析,利用数据挖掘中的序列模 式分析来建立热点预测模型,从而对舆情信息进行预测。如中国专利公开号为 CN101231641A的发明专利申请中根据互联网上热点主题传播过程和流程特点, 设计了一种热点分析监控方法和系统。
上述三类分析方法的主要特点是:第一类和第二类,可以判断热点信息, 但是具有明显的滞后性,应对热点舆情信息的突发不足;第三类的分析流程合 理,但是目前还没有较为成熟合理的预测模型。此外,上述三类分析方法都是 将内容和数值表现分开分析,没有很好的体现舆情整体表现。
发明内容
本发明的目的在于针对现有舆情热点分析方法的不足,提供一种网络舆情 的热点预测和分析方法,本发明将内容和数值表现结合在一起,是一种综合的 舆情热点监控方法,预测时间短,且预测效果准确。
本发明的目的通过下述技术方案实现:一种网络舆情的热点预测和分析方 法,包括以下步骤:步骤(1)、将及时采集的舆情信息输入基于内容快速识别的 热点舆情预测模型,根据处理结果将舆情信息分为热点舆情和普通舆情,对热 点舆情发出预警;步骤(2)、将普通舆情信息输入基于数值表现的热点预测模型, 从参与人数分布和时间状态分布上,对所输入的普通舆情信息进行数值模式匹 配,检测出步骤(1)所漏检的热点舆情信息;步骤(3)、对热点舆情进行分析; 步骤(4)、对热点舆情进行预测。
步骤(1)中所述的基于内容快速识别的热点舆情检测模型建立过程如下: 步骤(11)、收集舆情监控目标在一段时间内的热点舆情信息,并将所收集的热 点舆情信息分为M类,得到分类信息;步骤(12)、对步骤(11)所得的分类信 息进行预处理;步骤(13)、提取类关键词特征;步骤(14)、基于内容的分类 计算,建立类别空间向量,从而构建热点舆情检测模型。
步骤(12)所述的预处理为:利用中文分词系统对各类中的所有热点舆情 信息进行分词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910214401.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种南瓜粉丝
- 下一篇:牛奶果伴及其制作工艺