[发明专利]一种基于梯度提升树模型的高速公路事故预测方法及系统在审
申请号: | 202110405632.6 | 申请日: | 2021-04-15 |
公开(公告)号: | CN113283634A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 邹晓芳;张威奕;杨德元;卢佳程;刘砚 | 申请(专利权)人: | 招商新智科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F16/215;G06F16/22;G06K9/62 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 方昊 |
地址: | 100022 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 梯度 提升 模型 高速公路 事故 预测 方法 系统 | ||
1.一种基于梯度提升树模型的高速公路事故预测方法,其特征在于,包括:
收集历史事故数据,形成交通事故数据集;
对交通事故数据集进行数据清洗;
对数据清洗后的交通事故数据集进行数据预处理;
对数据预处理后的交通事故数据集进行特征提取,得到用于预测事故发生的关键变量;
结合梯度提升树模型,构建动态事故预测模型;
将交通事故数据集输入动态事故预测模型,利用关键变量对动态事故预测模型进行训练,获得训练后的动态事故预测模型;
将在线数据输入训练后的动态事故预测模型中,获得输出的预计事故值。
2.根据权利要求1所述的基于梯度提升树模型的高速公路事故预测方法,其特征在于,所述数据清洗包括数据格式化、数据异常值剔除和数据空缺值填补。
3.根据权利要求1所述的基于梯度提升树模型的高速公路事故预测方法,其特征在于,所述历史事故数据包括但不限于事故发生时间、事故发生路段、事故所处车道方向、事故发生天气和事故造成损失情况。
4.根据权利要求3所述的基于梯度提升树模型的高速公路事故预测方法,其特征在于,所述数据预处理包括:
通过数据聚合,根据事故发生时间和事故发生路段,统计自第一个交通事故开始以来,各路段、各时间段发生的事故数量和事故造成损失情况,形成交通事故案例聚合数据库;
通过独热编码方式,将交通事故案例聚合数据库的事故发生天气数据分隔为离散的多维向量;
将事故发生时间与实际的日历进行对应,提取出事故发生时间所在日期的属性,并将每一个属性各自作为一个独立的特征加入交通事故案例聚合数据库。
5.根据权利要求4所述的基于梯度提升树模型的高速公路事故预测方法,其特征在于,所述数据预处理还包括估计全日断面车流量,包括:
通过最近一天的车流量分布曲线,获得该小时断面车流量占全日断面车流量的比例;
估计全日断面车流量;
形成路段小时事故数据的稀疏矩阵。
6.根据权利要求1所述的基于梯度提升树模型的高速公路事故预测方法,其特征在于,所述结合梯度提升树模型,构建动态事故预测模型包括:
初始化,估计使损失函数极小化的常数值,其为只有一个根节点的树;
计算损失函数的负梯度在当前模型的值,将其作为残差的估计;
估计回归树叶节点区域,以拟合残差的近似值;
利用线性搜索估计叶节点区域的值,使损失函数极小化;
更新回归树;
得到输出的动态事故预测模型。
7.根据权利要求1所述的基于梯度提升树模型的高速公路事故预测方法,其特征在于,所述将交通事故数据集输入动态事故预测模型包括:
将所述交通事故数据集中的75%数据作为训练集,另外25%作为测试集。
8.一种基于梯度提升树模型的高速公路事故预测系统,其特征在于,包括:
数据收集模块,用于收集历史事故数据,形成交通事故数据集;
数据清洗模块,用于对交通事故数据集进行数据清洗;
数据预处理模块,用于对数据清洗后的交通事故数据集进行数据预处理;
特征提取模块,用于对数据预处理后的交通事故数据集进行特征提取,得到用于预测事故发生的关键变量;
模型构建模块,用于结合梯度提升树模型,构建动态事故预测模型;
模型训练模块,用于将交通事故数据集输入动态事故预测模型,利用关键变量对动态事故预测模型进行训练,获得训练后的动态事故预测模型;
预测模块,用于将在线数据输入训练后的动态事故预测模型中,获得输出的预计事故值。
9.根据权利要求8所述的基于梯度提升树模型的高速公路事故预测系统,其特征在于,所述历史事故数据包括但不限于事故发生时间、事故发生路段、事故所处车道方向、事故发生天气和事故造成损失情况;
所述数据预处理模块包括数据聚合模块、独热编码模块和日期判断模块;
所述数据聚合模块,用于通过数据聚合,根据事故发生时间和事故发生路段,统计自第一个交通事故开始以来,各路段、各时间段发生的事故数量和事故造成损失情况,形成交通事故案例聚合数据库;
所述独热编码模块模块,用于将交通事故案例聚合数据库的事故发生天气数据分隔为离散的多维向量;
所述日期判断模块,用于将事故发生时间与实际的日历进行对应,提取出事故发生时间所在日期的属性,并将每一个属性各自作为一个独立的特征加入交通事故案例聚合数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于招商新智科技有限公司,未经招商新智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110405632.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理