[发明专利]一种考虑风险因素时变特征的公路事故频次预测方法有效
申请号: | 202110021359.7 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112837533B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 陈一锴;于淑君;石琴;王飞;董满生 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06Q10/04;G06Q50/26;G06Q50/30 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 考虑 风险 因素 特征 公路 事故 频次 预测 方法 | ||
1.一种考虑风险因素时变特征的公路事故频次预测方法,其特征是按如下步骤进行:
步骤1、采集和处理历史交通事故数据及相关风险因素数据;
步骤1.1、将研究道路划分成K个同性质路段;
步骤1.2、建立训练集;
步骤1.2.1、在交通事故数据库中,获取研究道路的历史交通事故数据;
步骤1.2.2、依据历史事故的发生时间,采集事故发生时间前一段时间的交通状态数据;
步骤1.2.3、采用随机采样的方法,从研究道路的各路段未发生事故的时间中随机选择非事故事件的发生时间和所处路段,并依据抽取的非事故事件的发生时间和所处路段,采集非事故事件的交通状态数据;
步骤1.2.4、依据事故和非事故事件的所处路段,获取事故和非事故事件所处路段的道路几何特征数据;
步骤1.2.5、依据事故和非事故事件的发生时间,在气象站中提取天气数据;
步骤1.2.6、整合事故和非事故事件的交通状态、道路几何特征、天气数据,形成N个样本数据,从而得到训练集;在训练集中,将第i个样本是否为事故样本记为yi,若yi=1,表示第i个样本为事故样本,若yi=0,表示第i个样本为非事故样本;i=1,2,3,…,N;以事故和非事故事件的交通状态、道路几何特征、天气数据中的各个状态量作为相关风险因素;
步骤2、利用式(1)建立Logistic回归模型;
式(1)中,Bernoulli(·)表示伯努利分布,pi表示第i个样本为事故样本的概率;1-pi表示第i个样本为非事故样本的概率;β0为截距,βr为第r个风险因素的系数,xri为第i个样本中第r个风险因素的值,r=1,2,3,…,R;R表示风险因素的总数;
步骤3、利用所述训练集对Logistic模型进行参数估计,令β为β0和βr组成的向量,利用极大似然估计法,求出使如式(3)所示的似然函数L(β)取最大值时的估计参数β′:
步骤4、采用约登指数法计算Logistic模型的分类阈值;
步骤4.1、利用Logistic模型计算训练集中各样本的事故概率,并根据结果绘制ROC曲线;
步骤4.2、利用式(4)对ROC曲线上的每个点计算约登指数:
S(j)=Se(j)+Sp(j)-1 (4)
式(4)中,S(j)表示ROC曲线上第j个点的约登指数,Se(j)表示ROC曲线上第j个点的灵敏度值,Sp(j)表示ROC曲线上第j个点的特异度值;
步骤4.3、挑选最大约登指数对应的阈值作为分类阈值;
步骤5、基于Logistic模型和历史交通事故数据,计算模型的阳性预测值和阴性预测值;
步骤5.1、建立测试集;
步骤5.1.1、在交通事故数据库中,采集研究道路其他时间L内的历史交通事故数据;
步骤5.1.2、周期性采集研究道路中各路段在时间L内每一时刻前一段时间内的交通状态数据;
步骤5.1.3、采集在时间L内的每个时刻的天气数据;
步骤5.1.4、按照时间顺序,整合各路段的交通状态数据、天气数据、道路几何特征数据并依次形成若干个样本数据;
步骤5.1.5、根据时间L内的历史交通事故数据中所采集的事故发生的经纬度信息,将事故定位到相应路段上;
步骤5.1.6、根据时间L内事故的发生时间,将事故发生时间的对应样本数据标记为1,其余的样本数据作为非事故事件,标记为0,从而形成测试集;
步骤5.2、基于所述测试集中各时刻前一段时间内的交通状态数据、天气数据、道路几何特征数据,利用Logistic模型计算每个时刻的事故概率,并依据所述分类阈值,对事故概率进行分类,当概率大于分类阈值时,则认为发生交通事故,记为1,若概率小于分类阈值,则认为没有发生事故,记为0;
步骤5.3、根据测试集的事故概率分类结果和实际事故情况,统计以下数据:
(1)事故正确预测为事故的数量,并用TP表示;
(2)非事故正确预测为非事故的数量,并用FN表示;
(3)非事故被错误预测为事故的数量,并用FP表示;
(4)事故被错误预测为非事故的数量,并用TN表示;
步骤5.4、依据统计得到的数量FP和TP,利用式(5)计算阳性预测值PPV:
PPV=TP/(FP+TP) (5)
步骤5.5、依据统计得到的数量FN和TN,利用式(6)计算阴性预测值NPV:
NPV=FN/(FN+TN) (6)
步骤6、利用计算得到的阳性预测值和阴性预测值,进行事故频次预测;
步骤6.1、周期性采集预测时段内每一时刻前一段时间的交通状态、天气和道路几何特征数据,形成验证集,并利用Logistic模型计算每个时刻的事故概率;
步骤6.2、依据所述分类阈值,对所述验证集中各时刻的事故概率进行分类,当概率大于分类阈值时,则认为发生交通事故,记为1,若概率小于分类阈值,则认为没有发生事故,记为0;
步骤6.3、统计验证集中各路段标记为1的事故数量和标记为0的非事故数量;
步骤6.4、利用式(7)预测各路段的最终事故数:
Ck=Tk×PPV+Fk×NPV (7)
式(7)中,Ck表示第k个路段的最终事故数预测值,Tk表示第k个路段的事故数量,Fk表示第k个路段的非事故数量,k=1,2,…,K。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110021359.7/1.html,转载请声明来源钻瓜专利网。