[发明专利]基于lasso及随机森林的高拱坝谷幅变形分析方法有效
申请号: | 202010068541.3 | 申请日: | 2020-01-21 |
公开(公告)号: | CN111275341B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 徐卫亚;史宏娟;孟庆祥;杨兰兰;闫龙 | 申请(专利权)人: | 河海大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62;G06F30/20 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 lasso 随机 森林 拱坝 变形 分析 方法 | ||
1.一种基于lasso及随机森林的高拱坝谷幅变形分析方法,其特征在于,包括以下步骤:
(1)获取坝区现场的相关监测数据,建立数据分析体系,所述数据分析体系以谷幅影响因素值为自变量,以谷幅变形值为因变量;
(2)对所述监测数据进行预处理,剔除其中的异常值和缺失值;
(3)对预处理后的监测数据中的影响因素进行二次处理,确定影响因素的潜在影响方式,据此构建影响因素的相关影响因子,并确定高维影响因子组;
(4)根据所述高维影响因子组中的影响因子建立lasso分析模型并进行特征筛选,确定出一个或多个重要影响因子:
将所述高维影响因子组中的影响因子作为模型因子,建立lasso分析模型;对模型因子进行标准化处理,得到标准化影响因子,消除量纲的影响;通过最速下降算法进行特征筛选:将所述标准化影响因子带入模型计算,获得影响因子系数稀疏矩阵,并结合交叉验证法,多次计算,以模型方差为度量标准,选出误差最小的模型对应的模型系数,确定最优稀疏矩阵;
通过对多条测线变形全时段及具有明显相同变形特征的变形时段分别进行计算,根据计算结果,结合稀疏矩阵中影响因子出现的频次确定重要影响因子;
(5)将所述重要影响因子作为对应影响因素的代表影响因子,构建影响因素数据体系,用随机森林算法进行分析,划分训练集及预测集,以预测准确率作为检验标准,通过基尼系数对谷幅变形影响因素的重要程度进行排序;
(6)根据影响因素的重要程度排序来综合评价各影响因素对谷幅变形的影响。
2.根据权利要求1所述的方法,其特征在于,步骤(1)中,所述相关监测数据包括库水位升降速率、库水位高程、各测线谷幅变形累计值、坝区气温及坝区降雨量;其中,库水位升降速率、库水位高程、各测线谷幅变形累计值同步监测,坝区气温及降雨量数据选用国家气象数据中心气象数据集,以空间插值理论为基础,按监测点位置信息批量提取以获得降雨量及气温数据。
3.根据权利要求2所述的方法,其特征在于,所述数据分析体系的自变量包括库水位升降速率、库水位高程、坝区气温及降雨量,所述因变量为各测线谷幅变形累计值。
4.根据权利要求3所述的方法,其特征在于,步骤(3)包括:根据预处理后的降雨量和气温数据,统计前n天累计降雨量、前n天降雨量最大差值、前n天累计气温值、前n天气温值最大差值,确定l*m的高位影响因子组;其中n为统计的天数,l为潜在影响因子总数,m为影响因子数据集的数据组数。
5.根据权利要求1所述的方法,其特征在于,步骤(5)包括:
将重要影响因子作为对应影响因素的代表影响因子,结合库水位高程、库水位变化速率构建影响因素数据体系;
用随机森林算法进行分析,并将谷幅变形量按单位时间变形量大小将变形情况分类,进行划分训练集及预测集,将代表影响因子作为自变量,单位时间谷幅变形量类别作为分类变量,选取模型参数,计算模型预测准确率;
利用交叉验证法根据预测准确率选取最优模型,并计算最优模型下各影响因素的基尼系数,对谷幅变形影响因素的重要程度进行排序。
6.根据权利要求1所述的方法,其特征在于,步骤(2)中的异常值包括离群点及高杠杆点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010068541.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理