[发明专利]提升交通危险人员事故风险预测精度的方法有效
申请号: | 201810783017.7 | 申请日: | 2018-07-16 |
公开(公告)号: | CN108596409B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 刘林;陈凝;吕伟韬;马党生 | 申请(专利权)人: | 江苏智通交通科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
地址: | 211100 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提升 交通 危险 人员 事故 风险 预测 精度 方法 | ||
1.一种提升交通危险人员事故风险预测精度的方法,其特征在于:以优化的抽样方法获取交通违法数据与事故数据样本,采用集成学习算法训练交通参与者交通事故风险预测模型,进一步通过遗传算法进行模型优化以提升预测结果精确度,具体包括以下步骤:
S1、基于原始的交通违法数据与事故数据,构建违法数据集、严重事故数据集、轻微事故数据集;
S2、依据严重事故数据集的严重交通事故记录和轻微事故数据集的轻微事故记录,将违法数据集二分类,即高危人员、一般人员,根据分类规则确定数据标记值label,据此将违法数据集分为高危人员数据子集D、一般人员数据子集N以及待识别子集U;
S3、采用优化抽样方法与集成学习算法构建初始危险人员事故风险预测模型P0,确定模型抽样数、SMOTE抽样比例;步骤S3中所述的优化抽样方法具体步骤为:
S31、根据数据集N样本量设定抽样区间S以及循环步长k;
S32、样本量nm=s0+(m-1)·k,s0为抽样区间下限值,m为循环次数,初值为1;从数据集N中随机抽取样本量为nm的样本Nm;
S33、将数据集D与Nm合集Gm拆分为训练集和测试集;
S34、对训练集进行SMOTE抽样,设置高危人员数据子集D扩样比例ai;其中,当i=1时,ai=1,当i1时,ai=ai-1+1,i初值为1,i设有设定的取值上限;
S35、对于高危人员扩样比例ai,设置一般人员Nm数据子集缩样比例bj;其中,当j=1时,bj=1,当j1时,bj=bj-1+1,j初值为1,j设有设定的取值上限;对于SMOTE抽样比例ai:bj,进行训练集内两类标签样本的扩样、缩样处理,作为分类器的训练样本集;
S36、运用集成学习算法进行高危人员分类器的训练,确定模型参数,实现交通参与者交通事故风险预测模型的拟合,模型能够输出标记值以及风险概率;
S37、以测试集数据进行模型评估,获得不同覆盖率的模型精确度
S38、将一般人员数据子集N中的抽样样本Nm补集Nm’内数据根据违法次数分类,并按类别输入模型对不同覆盖率下模型输出的人员标签误判率进行统计
S39、j是否达到取值上限;若是,判断i是否达到取值上限,若是,则进入S310,否则i=i+1,转入S34;否则,j=j+1,转到S35;
S310、检测nm是否达到抽样区间上限值s,若是则进入S311,否则m=m+1,返回S32;
S311、由模型精确度、误判率分析具有最优性能的模型确定最优的随机抽样数M、SMOTE抽样比例I、J;
S4、采用遗传算法对模型P0进行性能优化,其优化目标函数为测试集预测精确度最大化,其中测试集精确度分析方法为k折交叉验证;设置遗传算法参数,使目标函数收敛速度快、避免震荡不收敛的情况;其中遗传算法参数包括交叉选择概率、变异概率、变异区间、种群繁殖代数、初始种群数量;
S5、根据遗传算法输出的目标最优模型参数,构建危险人员事故风险预测的最优拟合模型P,确定模型覆盖率recall以及模型判别阈值;
S6、将步骤S2的待识别子集数据输入模型P,输出目标对象危险度。
2.如权利要求1所述的提升交通危险人员事故风险预测精度的方法,其特征在于,步骤S3中所述的集成学习算法包括随机森林算法、AdaBoost算法、XgBoost算法、GBDT算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏智通交通科技有限公司,未经江苏智通交通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810783017.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理