[发明专利]基于事件文本数据挖掘的地下水水位分析方法与系统有效
申请号: | 201810074794.4 | 申请日: | 2018-01-25 |
公开(公告)号: | CN108182178B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 刘广泽;杨泊宁;刘雨哲;刘淑然;张艺馨 | 申请(专利权)人: | 刘广泽;杨泊宁;刘雨哲;刘淑然;张艺馨 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/289 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250061 山东省济南市历下区经十*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 事件 文本 数据 挖掘 地下水 水位 分析 方法 系统 | ||
本发明公开了一种基于事件文本数据挖掘的地下水水位分析方法和系统,所述方法包括:获取与地下水水位变化相关的事件数据;对所述与地下水水位变化相关的文本数据进行标签提取,所述标签包括与地下水水位变化相关的事件标签以及所述事件对应的时间;根据时间标签将事件标签进行排列、对齐;根据事件标签进行地下水位事件影响因素分析。本发明结合了多个系统中的与地下水水位变化有关的数据,整合了数据资源,且针对这些数据进行了关联分析,有助于找到影响水位的主要事件,并对地下水保护措施的成效进行评估,辅助决策。
技术领域
本发明涉及地下水水位分析分析领域,具体涉及一种基于从与地下水水位变化有关的新闻报道、公告等文本描述,及有关水文、气象数据,挖掘文本数据中的事件,进行地下水水位分析的方法和系统。
背景技术
济南市是著名的泉城,现代地质工作者调查研究认为,济南泉水(地下水)来源于市区南部山区,大气降水渗漏地下,顺岩层倾斜方向北流,至城区遇到侵入岩体阻挡,承压水出露地表,形成泉水。近年来,由于用水量的增加,以及城市建设对地下水系的判断,济南泉水水位变化涨跌不定,每年总有一段时间,泉水水位会下降到危险警戒线。对泉水水位涨落的分析分析和预测一直是一个重要的问题;研究者传统上采用水文地质调查、气象条件分析等手段分析和预测泉水水位。然而,济南泉水水位变化的因素是复杂的,降水、气温、农业生产、地下市政施工等各种影响因素交互作用,都可能影响泉水的正常喷涌;从历史数据的分析看,泉水事件对泉水水位涨落具有规律性地影响。挖掘影响地下水水位变化的关键因素,是本领域技术人员目前面临的核心问题。
影响泉水的诸多因素中,以非结构化的文本数据形态的存在比例较大,如新闻报道文本、施工公告文本、气象数据描述等都是以非结构化的文本形式存储,文本信息量较大,人为很难从中提取关键的信息。目前,以互联网为信息获取源,从中进行文本数据分析和挖掘十分常见,对网络产生的大规模真实语料库进行不同深度地加工,形成了一定规模的知识网络。因此,针对地下水位分析的具体情况,如何对上述“事件”文本数据进行分析,挖掘影响水位的关键因素,是本领域技术人员目前面临的技术问题。
发明内容
本发明的目的是为了克服地下水监控预测中与水位相关的原始数据分散、非结构化数据比例大,难以直观发现规律的问题,提出了一种基于事件文本数据挖掘的地下水水位分析的路线。
为实现上述目的,本发明采用如下技术方案:
一种基于事件文本数据挖掘的地下水水位分析方法,包括以下步骤:
获取与地下水水位变化相关的事件数据;
对所述与地下水水位变化相关的文本数据进行标签提取,所述标签包括与地下水水位变化相关的事件标签以及所述事件对应的时间;
根据时间标签将事件标签进行排列、对齐;
根据事件标签进行地下水位事件影响因素分析。
进一步地,所述与地下水水位变化相关的数据包括:从网络资源获取的与地下水水位变化相关的事件文本数据,包括农业灌溉数据、地下市政施工数据、违规抽取地下水、地下水回灌的描述性文本数据;水利部门公开发布的地下水水位观测数据;以及气象部门发布的气象观测数据。
进一步地,所述标签提取还包括提取描述所述事件程度的权重标签。
进一步地,所述地下水位事件影响因素分析包括地下水位事件关联分析、地下水位事件与地下水水位变化关联分析,和基于时间轴的地下水水位事件叠加影响分析。
进一步地,所述地下水位事件关联分析包括:
对事件描述数据进行标签提取,获取事件标签序列;
利用Apriori算法对事件标签系列进行频繁项集的提取。
进一步地,所述地下水位事件与地下水水位变化关联分析包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘广泽;杨泊宁;刘雨哲;刘淑然;张艺馨,未经刘广泽;杨泊宁;刘雨哲;刘淑然;张艺馨许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810074794.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数学试题知识点自动化标注方法和装置
- 下一篇:一种自然语言处理方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置