[发明专利]部署于互联网的舆情监测应用系统及运用方法在审
申请号: | 201310707843.0 | 申请日: | 2013-12-20 |
公开(公告)号: | CN103744877A | 公开(公告)日: | 2014-04-23 |
发明(设计)人: | 潘大庆;刘静姿;王静;黄力 | 申请(专利权)人: | 潘大庆 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中恒高博知识产权代理有限公司 11249 | 代理人: | 宋敏 |
地址: | 545006 广西壮族自治区柳*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 部署 互联网 舆情 监测 应用 系统 运用 方法 | ||
技术领域
本发明涉及信息通信领域,具体地,涉及一种部署于互联网的舆情监测应用系统及运用方法。
背景技术
目前,随着互联网应用越来越广泛,人们能够在互联网上表达自己的看法。当网络中的群体针对某一热点事件,集中关注并纷纷发表意见时,很容易形成网络舆情,网络舆情对国家安全、社会稳定和企业个人的声誉都会造成非常严重的影响,因此有效的开展舆情监测技术有着十分广泛的应用需求。然而随着互联网传输媒介的种类呈现多样化的发展趋势,互联网信息发布的源头呈现爆炸式的发展势头,使得在网络上开展实时有效的舆情监测技术难度越来越高,现有技术均不可以实时、全面的收集网络信息。
发明内容
本发明的目的在于,针对上述问题,提出一种部署于互联网的舆情监测应用系统及运用方法,以实现实时、全面的收集网络信息,从而避免网络谣言的优点。
为实现上述目的,本发明采用的技术方案是:
一种部署于互联网的舆情监测应用系统,包括数据采集子系统、基本数据存储中心、数据挖掘处理子系统和舆情监测管理子系统;
所述数据采集子系统:对网络上的信息进行自动采集,从对采集的信息进行去重、过滤、筛选后提取有分析价值潜力的网络信息;
所述基本数据存储中心:完成系统工作过程中所需要的数据存储功能;
所述数据挖掘处理子系统:通过预先设定的数据处理周期,对处于当前周期内的所有网络信息,首先进行分词和聚类提取出每个页面的核心内容,之后根据网络信息的排名回贴数据和转发次数,对网络信息的热门程度进行评价,给出网络信息的热点特征;
所述舆情监测管理子系统:实现人机交互,且对上述数据挖掘子系统输出的网络信息中的热点事件和页面的热门评价结果转化成舆情态势显示,并对热点事件进行统计,同时对舆情的发展趋势进行记录;且根据用户输入的检索关键词,对相关的原始网络信息进行检索和输出。
根据本发明的优选实施例,所述网络信息至少包括网络上的网页、微博和论坛信息。
根据本发明的优选实施例,所述数据采集子系统包括网络爬虫模块、数据去重模块、数据过滤模块和数据筛选模块;
所述网络爬虫模块,通过将网络爬虫在网络上进行自动的传播和扩散,从而自动的对网络上的网页、微博和论坛进行数据采集;
所述数据去重模块,将由上述网络爬虫采集到的页面原始数据经数据去重处理后,剔除在采集过程中所得到的重复数据;
所述数据过滤模块,根据预先设定的数据过滤规则,将不需要进行处理的页面类型和页面信息进行过滤;
所述数据筛选模块,根据上述舆情监测管理子系统内预先设定的数据采集敏感值,对所采集到的数据进行筛选,提取出有分析价值潜力的页面数据。
根据本发明的优选实施例,所述舆情监测管理子系统包括用户接口模块、舆情显示模块、热点统计模块、舆情趋势动向显示模块和数据检索模块;
所述用户接口模块、实现系统与用户之间的人机交互;
所述舆情显示模块、对上述数据挖掘子系统输出的各种热点事件和页面的热门评价结果转化成舆情态势显示;
所述热点统计模块、对热点事件进行统计;
所述舆情趋势动向显示模块,对舆情的发展趋势进行记录并显示;
所述数据检索模块、根据用户输入的检索关键词,对相关的页面原始数据进行检索和输出。
根据本发明的优选实施例,所述舆情显示模块,将其接收到的舆情信息分别在页面中实时的进行记录和显示。
根据本发明的优选实施例,所述舆情趋势动向显示模块,将在一段时间记录到的热点事件依次进行统计和记录,以曲线图的形式绘制热点事件。
根据本发明的优选实施例,所述数据挖掘处理子系统具有分词、分词聚类、页面排名统计、回贴数量统计、页面转发次数统计和处理周期设定功能。
同时本发明的技术方案还公开了一种权利部署于互联网的舆情监测应用系统的运用方法,包括以下步骤:
步骤1、通过舆情监测管理子系统中的用户接口模块,输入监测的敏感事件关键词;
步骤2、由数据采集子系统对网络数据进行采集,通过网络爬虫模块在互联网中快速进行传播,对多种信息媒介内容进行采集;
步骤3、将上述采集到的原始数据分别经过数据去重、数据过滤和数据筛选提取出有分析价值的页面数据;
步骤4、将上述步骤2采集到的原始数据送入基本数据存储中心,以通用的数据格式将所采集到的所有数据存储在基本数据存储中心;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于潘大庆,未经潘大庆许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310707843.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种小型化电子模块电路系统及其制作方法
- 下一篇:防潮型通信柜