[发明专利]基于XGBoost的水库大坝风险等级评估方法及系统在审
申请号: | 202110924472.6 | 申请日: | 2021-08-12 |
公开(公告)号: | CN113807570A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 丁炜;金有杰;高佳琦;刘娜;孙建庭;林艳燕;陈季;牛睿平 | 申请(专利权)人: | 水利部南京水利水文自动化研究所;江苏南水科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06Q50/06;G06N20/20;G06K9/62;G06F40/151 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 xgboost 水库 大坝 风险 等级 评估 方法 系统 | ||
本发明提供了基于XGBoost的水库大坝风险等级评估方法及系统,以特征工程技术预处理输入特征,规范化数据内容及格式;以数据驱动模型,降低主观因素对模型的影响;以GridSearch和Cross‑validation技术自适应计算模型最优参数,在提高工作效率的同时节约人力物力资源;以机器学习技术为核心构建评估预测模型,深入挖掘海量数据深层特征,自动识别水库大坝安全隐患的危险程度,提高水库大坝风险等级评估预测的效率及准确度,进而全面增强水库大坝风险预警能力,保障水库大坝长期安全运行。
技术领域
本发明属于水利水文技术领域,涉及基于水库大坝数据采集的安全风险评估方法,更为具体的说,是涉及基于XGBoost的水库大坝风险等级评估方法及系统。
背景技术
目前我国水库共有9.8万余座,大多兴建于上世纪50~70年代,由于历史、经济和技术原因导致相当部分水库大坝病险问题严重、溃坝风险突出,为了降低水库大坝失事概率必须定期进行风险评估,而当前水库大坝安全风险评估主要依靠经验丰富的科研技术人员对已有的水库大坝信息资料进行分析和评价,此种方式存在一些问题和不足:
(1)分析评价过程的自动化程度低。我国水库大坝工程质量的“先天不足”加之信息化水平程度低,使得当前评估水库大坝通过人工分析、人工建模、人工评价来实现,极大的耗费了人力物力,增加了技术人员的负担。
(2)建模与参数优化的智能化程度低。当前构建风险评估体系、建立风险评估模型对于指标因子的选取及权重设置多依靠历史统计数据、专家经验等主观方法,这导致构建的风险评估体系和风险评估模型使用时需要有相当经验的人员手动选择和确定参数,对水库管理人员而言使用较为困难。
(3)模型方法的通用程度低。为了针对性的提升评估模型的准确性,以往在构建模型之初便根据研究区域对模型输入特征、模型参数进行相关处理,一旦研究区域或者研究区域内部影响因子发生变化,该风险评估模型便不再适用,需要技术人员重新调整。
发明内容
为解决上述问题,本发明针对水库大坝不同类型的失事潜在风险影响因子(如筑坝材料、泄洪闸宽度等),提出了一种基于XGBoost的高通用性、高便捷性、高智能化和高准确率的水库大坝风险等级评估预测方法,提升水库大坝安全风险的预警能力。
本发明实现水库大坝(群)风险预测评估“智慧化”:通过清洗异常样本、对样本采样、归一化、离散化等特征工程技术实现输入特征的预处理,规范化数据内容及格式;以数据驱动模型,降低主观因素对模型的影响;以GridSearch和Cross-validation技术自适应计算模型最优参数,在提高工作效率的同时节约人力物力资源;以机器学习技术为核心构建评估预测模型,深入挖掘海量数据深层特征,提高模型的准确率。
为了达到上述目的,本发明提供如下技术方案:
一种基于XGBoost的水库大坝风险等级评估方法,包括如下步骤:
步骤一:获取水库大坝风险影响因子相关的特征数据(特征详细情况如表1所示)及风险等级表(表2),总览特征数据的主要数据类型、数据格式、数据缺失、方差、均值等情况,并对全部特征数据进行特征清洗、数据转换、数据填充等特征工程处理后得到数据集,处理过程主要包括:
(1)处理数据内容与标题不符、数据格式异常、数据内容缺失等问题;
(2)对文本特征进行特征变换,将大坝类型、防渗体类型、筑坝材料及筑坝目的等文本型数据利用LabelEncoder转换为数值型数据。
作为优选,对水库大坝特征数据集进行预处理及特征工程还可包括以下处理,如图5所示:
1、首先对特征值缺失情况进行统计,将缺失比例大于60%的无效特征删除;
2、针对具有数值类型和文本类型的水库大坝数据集,去除水库大坝数据集中重复特征信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于水利部南京水利水文自动化研究所;江苏南水科技有限公司,未经水利部南京水利水文自动化研究所;江苏南水科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110924472.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理