[发明专利]一种基于社会信号的灾害性气象热点事件识别方法有效
申请号: | 201810345881.9 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108595582B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 牛振东;朱一凡;陆浩;时恺泽 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35;G06F40/289;G06F40/30 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 毛燕 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社会 信号 灾害性 气象 热点 事件 识别 方法 | ||
本发明的目的是提出一种基于聚类特征模型的灾害性气象热点事件识别方法。具体步骤为:步骤一、构建灾害性气象关键词典。步骤二、对社会信号数据库中的数据进行预处理和特征提取。步骤三、发现与识别灾害性气象事件。本发明提出的基于聚类特征模型的灾害性气象热点事件识别方法与已有技术相比较,其优点在于:①在当前没有公认的气象相关关键词词典的环境下构建面向实际环境的关键词词典。②通过针对互联网中社会信号的处理,从“公众最关心”的角度发现识别气象事件,实现了基于社会的公众热点和基于自然的气象观测与预报之间的统一。③针对气象领域的特征进行了提取和聚类,从而相较于传统的通用事件发现方法提高了事件识别的准确率。
技术领域
本发明属于社会计算领域,涉及一种基于社会信号的灾害性气象热点事件识别方法,具体涉及一种使用计算机通过互联网信息作为数据源,自动分析并识别当前互联网环境中广泛关注并热议的灾害性气象事件的方法。
背景技术
当今社会已成为信息爆炸时代,互联网的迅猛发展,使得中国已经具有6亿多网民群体。社交网络(social network)的出现,为广大网民提供了更加自由和宽广的表现舞台。社交网络的核心价值在于用户之间的信息交换,即用户可以自由地创作内容并发布在一个或多个社交网络站点(social network sites,SNS),并经由它的观众通过转发等方式进行传播。另一方面,尽管传统的气象预报预警技术已经能够实现精确的灾害性气象的预报和预警,但是基于气候和气象学的天气预报预警与社会的实际反映和关注可能存在偏差。以2012年7月下旬北京强降水导致的内涝灾害为例,气象部门已经对强降水引发的潜在风险进行了预报和预警,但是民众对此灾害的发生仍然准备不足。不仅如此,之后在社交网络中(如新浪微博、天涯社区、微信公众号等)对该事件的关注程度也远远超出了强降雨这一气象灾害本身。因此可以发现,公众对于某一灾害性气象的关注度与参与度不仅仅与气象灾害的自身的强度有关。
目前已有相关的科学研究和发明聚焦于社会信号的采集与分析被用于其他某个或者多个领域。然而,这些通用的社会信号采集和分析技术不能有效地针对气象这一领域的某些独有特征进行利用,从而导致了识别效率低下甚至无法识别的问题。不仅如此,当前尚未有公认的针对气象社会信号的采集关键词典,从而使得原始信息的采集更加困难,最终导致后续的处理分析失败。
本发明采取半自动构建灾害性气象相关搜索词典并结合气象事件特征模型,提取互联网中的新闻、微博记录,并通过构建记录聚合方法最终实现对社会信号下的灾害性气象事件的发现与识别,该方法有效的解决了互联网中灾害性气象记录由于地理、内容和渠道等因素离散分布从而导致的聚合困难的问题,大幅提高了社会灾害性气象事件发现和识别的准确率。
发明内容
本发明的目的是为解决由于互联网中的灾害性气象相关记录离散分布,采用现有互联网事件发现机制识别时,会产生的准确度过低问题,提出一种基于聚类特征模型的灾害性气象热点事件识别方法。
本发明的目的是通过下述技术方案实现的。
本发明的一种基于聚类特征模型的灾害性气象热点事件识别方法,其特征在于:其具体实现步骤包括:
步骤一、构建灾害性气象关键词典。
步骤1.1:从网络系统中获取包含气象信息的新闻和微博文本,构成训练语料库,用符号ArticleSet表示。
步骤1.2:选取国家标准《GB/T 27962-2011气象灾害预警信号图标》规定的14种气象灾害名称,作为灾害性气象关键词基础词集,用符号KeywordDict_init表示。KeywordDict_init={台风,暴雨,暴雪,寒潮,大风,沙尘暴,高温,干旱,雷电,雹,霜冻,大雾,霾,道路结冰}。
表1 GB/T 27962-2011中规定的灾害性气象分类及预警级别
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810345881.9/2.html,转载请声明来源钻瓜专利网。