[发明专利]一种应用于区域路网的交通事故严重度预测方法有效

专利信息
申请号: 201910770584.3 申请日: 2019-08-20
公开(公告)号: CN110458244B 公开(公告)日: 2021-03-30
发明(设计)人: 石琴;杨慧敏;陈一锴;骆仁佳;于淑君;董满生 申请(专利权)人: 合肥工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06Q10/04;G06Q50/30
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230009 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种应用于区域路网的交通事故严重度预测方法,其步骤包括:1、区域路网交通事故数据的采集与预处理;2、基于区域路网交通事故数据,建立潜在类别分析模型;3、根据潜在类别分析结果,对各子类别分别建立CART决策树模型;4、对各子类别分别建立基于二元logistic回归的事故严重度模型(考虑自变量和交互作用项),并将敏感度与特异性曲线交点作为模型预测分类阈值。本发明能降低事故数据异质性对分析结果的不利影响,克服传统交通事故严重度预测模型忽略交互作用项和非平衡数据综合预测效果差的问题,提高事故严重度模型的预测精度和拟合优度。
搜索关键词: 一种 应用于 区域 路网 交通事故 严重 预测 方法
【主权项】:
1.一种应用于区域路网的交通事故严重度预测方法,其特征是按如下步骤进行:/n步骤一、区域路网道路交通事故数据的采集与预处理;/n从道路交通事故数据库中获取N起事故数据作为事故数据集D,并从任意第i起事故数据中选取K个分类变量组成集合X={x1,x2,…,xk,…,xK}来表征第i起事故,其中,xk表示第k个分类变量,且第k个分类变量xk包含Ck种类别,第k个分类变量xk在Ck种类别中的取值记为sk,令sik表示第i起事故的第k个分类变量的取值,则第i起事故中所有K个分类变量的取值所组成的分类变量取值集合记为Si={si1,si2,...,sik,...,siK};令表示第i起事故的K个分类变量的所有可能取值中的任意一种取值集合;k=1,2,3,...,K;i=1,2,3,...,N;/n将第i起事故的严重度作为预测变量,记为yi,且yi的取值为“0”或“1”分别表示非死亡事故和死亡事故;/n步骤二、根据区域路网道路交通事故数据,建立潜在类别分析模型;/n步骤2.1、定义所述潜在类别分析模型中存在一个潜在类别变量V,V包含T种类别,且任意一种类别记为t,t=1,2,...,T;令第i起事故中潜在类别变量V的取值记为Vi;/n步骤2.1.1、定义外循环次数为τ、最大外循环迭代次数为τmax;令第τ次所设置的类别数目为Tτ;初始化τ=1;/n步骤2.1.2、初始化t=1;/n步骤2.1.3、初利用式(1)得到第i起事故Vi取值为t,即属于第t种潜在类别时,第i起事故在K个分类变量上的取值集合为的条件概率/n /n式(1)中,P(sik=sk|Vi=t)表示第i起事故属于第t个潜在类别时,第k个分类变量上取值为sk的条件概率;/n步骤2.1.4、利用式(2)得到第i起事故中K个分类变量取值集合为的非条件概率即潜在类别分析模型的联合概率/n /n式(2)中,P(Vi=t)是第i起事故属于第t个潜在类别的概率,潜在类别t占总体的比率;/n步骤2.2、采用极大似然法进行模型参数估计,得到潜在类别概率和分类变量条件概率的估计值以及潜在类别分析模型的第τ次极大似然函数值Lτ;/n步骤2.3、利用式(3)计算第i起事故被分类到第t个潜在类别的后验概率/n /n步骤2.4、令t+1赋值给t,并判断t>Tτ是否成立,若成立,则执行步骤2.5;否则,返回步骤2.1.3执行;/n步骤2.5、利用式(4)、式(5)、式(6)和式(7)得到模型拟合评价指标,包括:第τ次信息评价指标AICτ、第τ次贝叶斯信息准则BICτ、第τ次样本校正的贝叶斯信息准则aBICτ、第τ次熵值/nAICτ=-2ln(Lτ)+2M (4)/nBICτ=-2ln(Lτ)+ln(N)×M (5)/naBICτ=-2ln(Lτ)+ln(n*)×M (6)/n /n式(4)、式(5)、式(6)和式(7)中,M为潜在类别分析模型中未知参数的个数;n*是调整后的样本量,且n*=(N+2)/24;/n步骤2.6、将τ+1赋值给后τ,判断τ>τmax是否成立,若成立,则返回步骤2.7;否则,执行步骤2.1.3;/n步骤2.7、从τmax次信息评价指标AIC、贝叶斯信息准则BIC、样本校正的贝叶斯信息准则aBIC和熵值R2中选出各个模型拟合评价指标均取到最优值时所对应的潜在类别个数,记为T*;将所述事故数据集D划分为T*个事故子类别,记为表示第t*个事故子类别中的事故数据,t*=1,2,…,T*;/n步骤三、根据潜在类别分析模型结果,对T*个子类别分别建立CART决策树模型;/n步骤3.1、令所述第t*个事故子类别中的事故数据作为训练样本集,令K个分类变量所组成的集合X为所述CART决策树模型中的特征集;令结点样本阈值为σ、特征值切分点为α、Gini指数阈值为ε;/n步骤3.2、初始化t*=1;/n步骤3.3、将所述训练样本集特征集X、定义结点样本阈值σ和Gini指数阈值ε输入所述CART决策树模型;/n步骤3.4、令t*+1赋值给t*,并判断t*>T*是否成立,若成立,则表示得到T*个决策树,并执行步骤3.5;否则,返回步骤3.3执行;/n步骤3.5、根据所述T*个二叉决策树的树形图,确定分类变量间的交互作用项,其中,第t*个事故子类别对应的二叉决策树所确定的交互作用项;/n步骤四、对T*个子类别分别建立基于二元logistic回归的事故严重度模型;/n步骤4.1、将所述第t*个子类别中的事故数据作为事故严重度模型的拟合数据,以K个分类变量所组成集合X和第t*个子类别的交互作用项共同作为所述事故严重度模型的自变量X*;定义第t*个事故子类别包含J个事故数据,J的值为第j起事故的预测变量记为yj;/n步骤4.2、初始化t*=1;/n步骤4.3、利用式(11)得到基于二元logistic回归在自变量X*条件下死亡事故即yj=1的发生概率P(y=1|X*):/n /n式(11)中,w*为自变量X*的回归系数;/n步骤4.4、利用极大似然法估计所述二元logistic回归的事故严重度模型的参数w*:/n对于第j起事故,为给定自变量条件下yj=1的概率,则给定自变量条件下yj=0的概率为1-Pj;并利用式(12)得到似然函数L(w*):/n /n利用极大似然估计,求出使得L(w*)取得最大值时的估计参数w′;/n根据估计参数w′得到第j起事故在自变量条件下yj=1的预测概率从而得到J起事故的预测概率并进行升序排序,得到排序后的预测概率集合记为{P′1,...,P′j,...,P′J};/n步骤4.5、调整事故严重度模型的预测分类阈值;/n步骤4.6、令t*+1赋值给t*,并判断t*>T*是否成立,若成立,则表示获得T*个事故严重度预测模型,否则,返回步骤4.3执行。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910770584.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top