[发明专利]一种基于普适性元规则的交通事故致因挖掘方法有效

专利信息
申请号: 201810781739.9 申请日: 2018-07-17
公开(公告)号: CN108717786B 公开(公告)日: 2022-06-17
发明(设计)人: 曾维理;赵子瑜;李娟;任禹蒙;孙煜时;羊钊 申请(专利权)人: 南京航空航天大学
主分类号: G08G1/01 分类号: G08G1/01;G06F16/2458;G06F16/215;G06Q50/26
代理公司: 南京经纬专利商标代理有限公司 32200 代理人: 施昊
地址: 211106 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于普适性元规则的交通事故致因挖掘方法。该方法通过读入历年交通事故信息,对数据进行预处理后,根据道路交通事故分类标准对每条事故记录进行等级划分,在此基础上运用关联规则分析方法,设置最小支持度、最小置信度和频繁指数的合理阈值,对多数据集进行阈值一致的关联规则挖掘,构建各数据集与强关联规则的二值数据集,进而提取元规则集,再集合元规则集及数据集进行二次挖掘,整合多组数据集中的元规则,得到以元胞模式输出、具有普适特征的多元规则构成的输出规则。本发明能够挖掘出传统关联规则中的隐藏关联信息,筛选有价值的规则,剔除不具有多片区普适特征的关联规则,为交通安全管理者提供决策辅助。
搜索关键词: 一种 基于 普适性元 规则 交通事故 挖掘 方法
【主权项】:
1.一种基于普适性元规则的交通事故致因挖掘方法,其特征在于,包括以下步骤:步骤一、数据准备步骤1.1:读取历年交通事故信息,并将其分为事故基本信息、涉事驾驶人信息、事故车辆信息、道路条件信息和环境信息5类交通事故致因信息,且每类交通事故致因信息采用多属性描述;步骤1.2:对读取的交通事故信息进行数据质量分析,筛选保留质量合格的属性变量;步骤1.3:对筛选后的交通事故信息进行属性选择,将与挖掘任务不相关或者冗余的属性剔除,属性选择的目标是找出最小属性集,同时保证数据集的概率分布尽量接近利用所有属性得到的原分布;步骤1.4:对步骤1.3得到的交通事故信息进行数据清洗,包括缺失值处理和噪声过滤;缺失值处理采用删除法,剔除5类交通事故致因信息中属性缺失度超过预设缺失阈值的信息;噪声过滤采用基于统计学方法的离群点检测算法,诊断出数据中的离群点,并删除;步骤1.5:对连续性分布的属性进行聚类处理,同时,根据道路交通事故分类标准对每条事故进行分类;步骤二、参数选取步骤2.1:根据下列方法计算规则的支持度和置信度:规则在交通数据集T中的支持度如下:其中,规则在交通数据集T中的置信度如下:其中,对于规则X称为规则的前件,Y称为规则的后件,规则R的支持度表示事故致因X和事故致因Y同时发生的概率,规则R的置信度表示在事故致因X发生时,事故致因Y同时发生的条件概率,当规则R的置信度大于预先设置的阈值时,认为X事件的发生诱导了Y事件的发生,置信度越大,说明两者间的联系越紧密;步骤2.2:选择最小支持度S阈值:对不同行政区域交通数据集的不同类别事故进行区分后,根据公式(1)对不同区域的规则进行支持度计算,得到满足最小支持度阈值的关联规则数量和最小支持度阈值的关系图;通过选取不同的最小支持度阈值,以最小支持度阈值为横坐标,以满足最小支持度阈值的关联规则数量为纵坐标,得到各类事故各区域支持度阈值选取趋势图,进行最小支持度阈值选取;步骤2.3:选择最小置信度C阈值:对不同类型下的交通事故数据集,根据公式(1)和(2)对不同区域的规则进行支持度和置信度计算,设置不同的支持度和置信度阈值进行比较分析,得到满足阈值条件的规则分布与阈值设置的气泡关系图,以权衡支持度和置信度阈值的选择范围,其中横坐标对应支持度阈值,纵坐标对应置信度阈值,气泡数量越大,表示包含的关联规则数量越多;步骤2.4:选择频繁指数F阈值:在不同交通数据集之间,筛选普适性元规则的指标为频繁指数,根据不同数据集中分别挖掘得到的关联规则,建立基于多数据集的关联规则频繁指数表,满足频繁指数阈值的关联规则作为普适性元规则,其中,各数据集在挖掘关联规则时采取一致的支持度和置信度阈值,通过布尔变量1和0分别表示存在规则和不存在规则,规则Ri的频繁指数定义如下:其中,pij为规则Ri在数据集Tj中的判断值,规则Ri在数据集Tj中存在,则pij取1,否则pij取0,n为数据集数量;为了得到在多区域具有普适性的元规则,同时保证得到的普适性元规则具有分析意义,对各区域不同类型的交通事故数据集进行关联筛选,筛选出各区域中重复出现的关联规则,并以频繁指数阈值为横坐标,以强关联规则数量为纵坐标,得到各类事故的关联规则区域关联趋势图,进行频繁指数阈值选取;步骤三、基于元规则的关联规则挖掘步骤3.1:对多个格式相同数据集T1,T2,…,Ti设置一致的最小支持度S和最小置信度C,进行一次关联规则挖掘,得到对应的关联规则R1,R2,…,Ri;步骤3.2:根据各关联规则在不同数据集中的频繁指数,通过频繁指数F阈值筛选,提取元规则,确立元规则集;步骤3.3:结合元规则集及数据集T1,T2,…,Ti进行二次挖掘,整合多组数据集中的元规则;步骤3.4:根据最小支持度S和最小置信度C进行强关联规则输出,并导出基于导致交通事故类型关联因素的元规则,得到以元胞模式输出、具有普适特征的多元规则构成的输出规则;步骤四、规则分析根据生成的不同类型事故下的多元规则构成的强关联规则,定性和定量分析各个事故致因之间的关联性,为决策层面提供参考依据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810781739.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top