[发明专利]舆情分析方法及装置在审
申请号: | 201710580702.5 | 申请日: | 2017-07-17 |
公开(公告)号: | CN107451213A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 晋彤;李永康 | 申请(专利权)人: | 广州特道信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 梁顺宜,郝传鑫 |
地址: | 510000 广东省广州市越秀*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 舆情 分析 方法 装置 | ||
技术领域
本发明涉及计算机领域,尤其涉及一种舆情分析方法及装置。
背景技术
在互联网高度发展的今天,网络舆情分析因为其网络舆情信息获取的快捷和准确,内容分析的确定,舆情响应的及时,已经发展为网络舆情分析的最为重要的手段。在网络舆情分析技术中,倾向性分析并不关注舆情分析的应用领域,仅用于对网络舆情的倾向性进行判断。倾向性分析又可以被分为基于语气词标注的倾向性分析,以及基于机器学习的倾向性分析。基于语气词标注的方法严重依赖于标注专家且不利用训练样本,其分类精度往往不如基于机器学习的方法。而现有的基于机器学习的倾向性分析方法又取决于训练集的大小与质量。由于已有的标注语料库的规模都很小,因而这类有监督的倾向性分析方法的效果仍然难以保证。
发明内容
本发明实施例的目的是提供一种舆情分析方法及装置,能实现敏感舆情的有效预警,提高准确性和时效性,效率高。
为实现上述目的,本发明实施例提供了一种舆情分析方法,包括步骤:
采用分布式蜘蛛采集技术采集各站点数据;
将所述各站点数据进行自动聚类,识别所述各站点数据中的热点事件;
自动抽取所述热点事件的摘要,分析所述热点事件的倾向性语义,获得所述热点事件的舆情信息。
与现有技术相比,本发明公开的舆情分析方法通过采用分布式蜘蛛采集技术采集各站点数据,然后将所述各站点数据进行自动聚类,识别所述各站点数据中的热点事件,再自动抽取所述热点事件的摘要,分析所述热点事件的倾向性语义,获得所述热点事件的舆情信息,能实现敏感舆情的有效预警,提高准确性和时效性,效率高。
作为上述方案的改进,所述采用分布式蜘蛛采集技术采集各站点数据具体为:
定向监控网站及所述网站的更新频率;
根据所述网站的敏感度、活跃度将各个目标信源进行权重赋值,根据不同的权重以不同的采集频率采集各个站点的数据。
作为上述方案的改进,所述自动抽取所述热点事件的摘要前还包括:
通过热点聚焦算法自动聚焦所述热点事件在主要站点的动态走势,统计媒体和网络名人的点评走势。
作为上述方案的改进,通过热点聚焦算法自动聚焦所述热点事件在主要站点的动态走势具体为:
采用关键词命中的方式获得所述热点事件在每一主要站点的倾向,根据所述
每一主要站点的倾向获取所述热点事件在主要站点的动态走势。
本发明实施例还提供了一种舆情分析装置,包括:
采集模块,用于采用分布式蜘蛛采集技术采集各站点数据;
识别模块,用于将所述各站点数据进行自动聚类,识别所述各站点数据中的热点事件;
舆情信息获取模块,用于自动抽取所述热点事件的摘要,分析所述热点事件的倾向性语义,获得所述热点事件的舆情信息。
与现有技术相比,本发明公开的舆情分析装置通过采用分布式蜘蛛采集技术采集各站点数据,然后将所述各站点数据进行自动聚类,识别所述各站点数据中的热点事件,再自动抽取所述热点事件的摘要,分析所述热点事件的倾向性语义,获得所述热点事件的舆情信息,能实现敏感舆情的有效预警,提高准确性和时效性,效率高。
作为上述方案的改进,所述采集模块具体用于定向监控网站及所述网站的更新频率;根据所述网站的敏感度、活跃度将各个目标信源进行权重赋值,根据不同的权重以不同的采集频率采集各个站点的数据。
作为上述方案的改进,所述舆情信息获取模块还用于通过热点聚焦算法自动聚焦所述热点事件在主要站点的动态走势,统计媒体和网络名人的点评走势。
作为上述方案的改进,通过热点聚焦算法自动聚焦所述热点事件在主要站点的动态走势具体为:
采用关键词命中的方式获得所述热点事件在每一主要站点的倾向,根据所述每一主要站点的倾向获取所述热点事件在主要站点的动态走势。
附图说明
图1是本发明实施例1提供的一种舆情分析方法的流程示意图。
图2是本发明实施例2提供的一种舆情分析装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明实施例1提供的一种舆情分析方法的流程示意图,包括步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州特道信息科技有限公司,未经广州特道信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710580702.5/2.html,转载请声明来源钻瓜专利网。