[发明专利]抽取互联网多维涉灾信息的灾情监测分析方法有效
申请号: | 201810597449.9 | 申请日: | 2018-06-11 |
公开(公告)号: | CN108897792B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 解吉波;杨腾飞;李国庆 | 申请(专利权)人: | 中国科学院遥感与数字地球研究所 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/35;G06F40/247 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 100101 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抽取 互联网 多维 信息 灾情 监测 分析 方法 | ||
本公开提供了一种抽取互联网多维涉灾信息的灾情监测分析方法,包括:S1:多源数据的实时获取与预处理;S2:通过特征词多维扩展算法FWME辅助构建灾情信息抽取知识库来抽取灾害损失信息以及灾害受众群体的情绪反馈信息,用于获取多维涉灾信息;S3:根据多维涉灾信息对灾区作联合监测与分析。通过构建的灾情信息抽取知识库,精确地抽取互联网平台中蕴含的灾害损失信息和灾害过程中受众群体的情绪反馈信息,并结合时间和空间维度作联合分析,详细刻画了灾情进展过程,并辅助用于灾情实时监测、灾损评估分析、灾情救援反馈以及后续影响评估等工作。
技术领域
本发明涉及灾害监测分析技术领域,具体涉及基于互联网多源文本数据抽取多维度涉灾信息作灾害监测分析。
背景技术
我国是灾害多发国家,每年因各种灾害造成了大量的人员和财产损失,基于传统的灾害监测方法如卫星遥感、人工调查等,常常因实施条件苛刻、成本较高等缺点难以及时发挥效用。且一些灾情信息如灾害受众群体的情绪反馈等是传统灾情监测方法难以做到的,而这些信息同样是灾情监测分析中极其重要的。
目前很多学者基于社交媒体对灾情进行监测分析,如时空维度探究台风移动轨迹、人类行为规律等,或是基于文本内容,挖掘台风、地震等灾害发生时公众关注热点、情感态度等信息。然后这些方法监测粒度较粗,针对性不强,不能够具体描述灾害造成的损失细节信息,也无法反应公众对政府救援活动的情绪反馈。
从互联网文本中抽取细粒度的涉灾信息,通常这些信息所在上下文特征非常稀疏,且同一文本中往往包括多个细粒度灾情主题。基于传统的监督学习方法不仅需要人工标注大规模训练语料,且其多针对于单一主题的文本分类。而传统的基于规则的方法,则需要大量的专家知识来总结抽取规则,可移植性较差。
发明内容
(一)要解决的技术问题
本公开提供了一种抽取互联网多维涉灾信息的灾情监测分析方法,以至少部分解决以上所提出的技术问题。
(二)技术方案
根据本公开的一个方面,提供了一种抽取互联网多维涉灾信息的灾情监测分析方法,包括:
S1:多源数据的实时获取与预处理;
S2:通过特征词多维扩展算法FWME辅助构建灾情信息抽取知识库来抽取灾害损失信息以及灾害受众群体的情绪反馈信息,用于获取多维涉灾信息;
S3:根据多维涉灾信息对灾区作联合监测与分析。
在本公开一些实施例中,所述的步骤S1中的多源数据来自于多个互联网平台,利用与指定灾情相关的关键词通过搜索引擎获取;所述预处理包括文本去重、繁简转换以及全半角转换,以及对文本数据的时间戳信息和位置信息进行提取并单独存储。
在本公开一些实施例中,步骤S2中利用特征词多维扩展算法FWME辅助构建灾情信息抽取知识库来抽取灾害损失信息以及灾害受众群体的情绪反馈信息,包括:
S21:构建灾情信息抽取知识库;
S22:基于特征词多维扩展算法FWME纵向和横向扩展灾情信息抽取知识库中的各类特征词;
S23:抽取灾害损失信息以及灾害受众群体的情绪反馈信息。
在本公开一些实施例中,所述步骤S21中,所述的灾情信息抽取知识库包括灾损信息识别知识库以及公众情绪反馈知识库,利用文本中蕴含的灾损和公众情绪特征词作识别和分类,同时考虑对文本语义起反作用的否定词和促进作用的程度词。
在本公开一些实施例中,所述的灾情信息抽取知识库,其结构表示为一棵高度为4层的树,其中该树的顶层为灾情信息抽取知识库,第2层包括两棵子树,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院遥感与数字地球研究所,未经中国科学院遥感与数字地球研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810597449.9/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置