[发明专利]部署于互联网的舆情监测应用系统及运用方法在审
申请号: | 201310707843.0 | 申请日: | 2013-12-20 |
公开(公告)号: | CN103744877A | 公开(公告)日: | 2014-04-23 |
发明(设计)人: | 潘大庆;刘静姿;王静;黄力 | 申请(专利权)人: | 潘大庆 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京中恒高博知识产权代理有限公司 11249 | 代理人: | 宋敏 |
地址: | 545006 广西壮族自治区柳*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 部署 互联网 舆情 监测 应用 系统 运用 方法 | ||
1.一种部署于互联网的舆情监测应用系统,其特征在于,包括数据采集子系统、基本数据存储中心、数据挖掘处理子系统和舆情监测管理子系统;
所述数据采集子系统:对网络上的信息进行自动采集,从对采集的信息进行去重、过滤、筛选后提取有分析价值潜力的网络信息;
所述基本数据存储中心:完成系统工作过程中所需要的数据存储功能;
所述数据挖掘处理子系统:通过预先设定的数据处理周期,对处于当前周期内的所有网络信息,首先进行分词和聚类提取出每个页面的核心内容,之后根据网络信息的排名回贴数据和转发次数,对网络信息的热门程度进行评价,给出网络信息的热点特征;
所述舆情监测管理子系统:实现人机交互,且对上述数据挖掘子系统输出的网络信息中的热点事件和页面的热门评价结果转化成舆情态势显示,并对热点事件进行统计,同时对舆情的发展趋势进行记录;且根据用户输入的检索关键词,对相关的原始网络信息进行检索和输出。
2.根据权利要求1所述的部署于互联网的舆情监测应用系统,其特征在于,所述网络信息至少包括网络上的网页、微博和论坛信息。
3.根据权利要求2所述的部署于互联网的舆情监测应用系统,其特征在于,所述数据采集子系统包括网络爬虫模块、数据去重模块、数据过滤模块和数据筛选模块;
所述网络爬虫模块,通过将网络爬虫在网络上进行自动的传播和扩散,从而自动的对网络上的网页、微博和论坛进行数据采集;
所述数据去重模块,将由上述网络爬虫采集到的页面原始数据经数据去重处理后,剔除在采集过程中所得到的重复数据;
所述数据过滤模块,根据预先设定的数据过滤规则,将不需要进行处理的页面类型和页面信息进行过滤;
所述数据筛选模块,根据上述舆情监测管理子系统内预先设定的数据采集敏感值,对所采集到的数据进行筛选,提取出有分析价值潜力的页面数据。
4.根据权利要求2所述的部署于互联网的舆情监测应用系统,其特征在于,所述舆情监测管理子系统包括用户接口模块、舆情显示模块、热点统计模块、舆情趋势动向显示模块和数据检索模块;
所述用户接口模块、实现系统与用户之间的人机交互;
所述舆情显示模块、对上述数据挖掘子系统输出的各种热点事件和页面的热门评价结果转化成舆情态势显示;
所述热点统计模块、对热点事件进行统计;
所述舆情趋势动向显示模块,对舆情的发展趋势进行记录并显示;
所述数据检索模块、根据用户输入的检索关键词,对相关的页面原始数据进行检索和输出。
5.根据权利要求4所述的部署于互联网的舆情监测应用系统,其特征在于,所述舆情显示模块,将其接收到的舆情信息分别在页面中实时的进行记录和显示。
6.根据权利要求4所述的部署于互联网的舆情监测应用系统,其特征在于,所述舆情趋势动向显示模块,将在一段时间记录到的热点事件依次进行统计和记录,以曲线图的形式绘制热点事件。
7.根据权利要求2所述的部署于互联网的舆情监测应用系统,其特征在于,所述数据挖掘处理子系统具有分词、分词聚类、页面排名统计、回贴数量统计、页面转发次数统计和处理周期设定功能。
8.一种权利要求1至7所述的部署于互联网的舆情监测应用系统的运用方法,其特征在于,包括以下步骤:
步骤1、通过舆情监测管理子系统中的用户接口模块,输入监测的敏感事件关键词;
步骤2、由数据采集子系统对网络数据进行采集,通过网络爬虫模块在互联网中快速进行传播,对多种信息媒介内容进行采集;
步骤3、将上述采集到的原始数据分别经过数据去重、数据过滤和数据筛选提取出有分析价值的页面数据;
步骤4、将上述步骤2采集到的原始数据送入基本数据存储中心,以通用的数据格式将所采集到的所有数据存储在基本数据存储中心;
步骤5、启动数据挖掘处理子系统中的分词功能,依次从基本数据存储中心提取页面数据,并从中抽取出各分词结果;
步骤6、应用分词聚类功能的分词聚类算法对分词结果进行聚类,给出每一个页面的主体内容描述;
步骤7、启动页面排名统计、页面回贴次数统计和页面转发次数统计功能,按照页面数据的类型分别相应的计入页面的特征参数;
步骤8、应用热点事件评价模型对当前页面的内容、热门程度进行评价;
步骤9、如果事件达到预先设定的热门敏感程序预值,则进行热点事件的报警,将预警结果输出至舆情监测管理子系统;
步骤10、所述舆情监测管理子系统针对所接收到的预警信息,将舆情状况实时的进行显示,同时对累计收到的各种热点事件进行统计,并对舆情发展趋势进行显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于潘大庆,未经潘大庆许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310707843.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种小型化电子模块电路系统及其制作方法
- 下一篇:防潮型通信柜