[发明专利]新闻舆情监测系统有效
申请号: | 201510009993.3 | 申请日: | 2015-01-09 |
公开(公告)号: | CN104504150B | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 张鹏 | 申请(专利权)人: | 成都布林特信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京天奇智新知识产权代理有限公司11340 | 代理人: | 郭霞 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻 舆情 监测 系统 | ||
技术领域
本发明涉及互联网信息处理技术领域,具体来讲,涉及一种新闻舆情监测系统。
背景技术
随着互联网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。
网络舆情是通过互联网传播的,公众对现实生活中某些热点、焦点问题所持的有较强影响力、倾向性的情感、态度、意见、言论或观点,其主要通过论坛BBS上的发帖评论及跟贴、博客Blog等实现并加以强化。由于互联网具有虚拟性、隐蔽性、发散性、渗透性和随意性等特点,越来越多的网民乐意通过这种渠道来表达观点、传播思想。
网络舆情是一股强大的舆论力量,会反作用于热点事件并对社会发展和事态进程产生一定的影响。由于网络的开放性,会导致网络舆情形成迅速,对社会影响巨大。特别是当出现负面的网络新闻舆情时,若不能及时了解、有效引导,很容易形成舆论危机,严重时甚至影响公共安全。对网络新闻舆论危机的积极化解,对维护社会稳定、促进国家发展具有重要的现实意义,也是创建和谐社会的应有内涵。对网络新闻舆情观点进行收集具有相当重要的意义,在一个热点事件的发展过程中网民观点起着至关重要的作用,甚至可以被认为是网络新闻舆情的核心。
最近,随着互联网技术的迅速发展,以新闻媒体等为代表的新媒体打破信息的控制和垄断,在网络上人们自由表达自己的态度和意见,不再像过去那么容易地无条件接受,相反,不同阶层的利益诉求纷纷呈现,不同思想观点正面碰撞。对相关政府部门来说,如何及时准确的了解网络新闻舆情,加强对网络新闻舆论的及时监测、有效引导,成为网络新闻舆情管理的一大难点。在这种情况下,建设能够覆盖新闻数据源的新闻舆情监测系统十分必要,此类系统可针对新的新闻媒介传播环境,进一步深入研究新闻舆情的热点研判方法以及新媒体带来的影响,对新闻舆情研究进行丰富和完善。
虽然目前已经有很多单位针对网络新闻舆情监控提出了一些不同的解决方案。但是,需要本领域技术人员解决的技术问题是如何提高判断网络新闻舆情信息的效率和精确度。因为截至目前,尚未有较为高效、准确的针对新闻媒体数据的网络舆情监测系统。
发明内容
本发明就是针对上述背景技术中的不足之处,而提出的一种新闻媒体的舆情监测系统,其具有较高的准确率。本发明的目的是通过如下技术措施来实现的。
本发明提出一种新闻舆情监测系统,该系统包括新闻信息采集模块1、新闻数据预处理模块2、新闻舆情分析模块3和新闻舆情结果显示模块4,其中
新闻信息采集模块1用于对互联网上的新闻舆情信息进行采集,获取新闻数据;
新闻数据预处理模块2用于将新闻信息采集模块1获取的新闻数据中的无用信息去除,并对去除了无用信息的所述新闻数据进行必要的整理;
新闻舆情分析模块3以新闻数据预处理模块2整理的新闻数据为基础,采用多个新闻热点发现子模块发现新闻舆情热点;
新闻舆情结果显示模块4以图表或报告形式输出新闻舆情分析结果,实现用户交互功能。
优选地,所述新闻信息采集模块1用于根据指定的关键词、来源URL或信息主题,使用基于链接分析的搜索引擎网络爬虫方法,通过多线程下载队列并发地自动采集多种类型的新闻舆情信息;其中,所述多种类型的新闻舆情信息至少包括新闻的文本信息和/或图片信息;并且
所述新闻数据预处理模块2包括:初步过滤子模块2a、正文提取子模块2b、分词子模块2c、特征短语过滤子模块2d、文本情感倾向性分析子模块2e、图片分析子模块2f和舆情热度获取子模块2g。
优选地,所述初步过滤子模块2a,用于对新闻数据中的信息进行初步过滤,清除所述新闻数据中的噪声,对每条新闻数据进行以下处理:
步骤2a-1,对于每条新闻数据,按照标题进行语义分析,检测出网络中与该条新闻数据相似的所有新闻数据,得到该条新闻数据的相似组;如果未发现与该条新闻数据相似的新闻数据,则该条新闻数据的相似组为其本身;
步骤2a-2,对于每条新闻数据,将网络中所有位置出现的该条新闻数据的相似组中所有新闻数据的总数量除以发布该条新闻数据的相似组中所有新闻数据的网络地址的总数量,得到该条新闻数据的空间重复度值S1;
步骤2a-3,对于每条新闻数据,计算网络中出现的该条新闻数据的相似组中所有新闻数据的总数量,得到该条新闻数据的时间重复度值S2;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都布林特信息技术有限公司,未经成都布林特信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510009993.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据聚合查询的方法及装置
- 下一篇:一种视频检索方法及装置