[发明专利]一种基于多重对应和K-means聚类的交通事故成因分析方法有效
申请号: | 201811150213.7 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109408557B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 夏井新;樊朋光;王晨;宋燕超;刘林 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/22;G06F16/28;G06Q50/26 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王安琪 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多重 应和 means 交通事故 成因 分析 方法 | ||
本发明公开了一种基于多重对应和K‑means聚类的交通事故成因分析方法,包括如下步骤:(1)根据获取的交通事故数据集,选取影响交通事故发生的变量并分类;(2)通过数据库统计各变量的类别数和相应事故数量,筛选合并异常值的变量类别,得到事故数据表;(3)将得到的事故数据表处理得到二进制指标矩阵;(4)将事故类型作为表征事故特征的变量进行多重对应分析,得到各变量类别的多重对应分析坐标;(5)使用局部线性嵌入算法对事故数据多重对应分析所得变量类别坐标进行降维,得到LLE降维坐标;(6)使用K‑means聚类算法对变量类别进行聚类,并根据聚类结果进行分析。本发明根据聚类结果从多维度综合探究交通事故成因,不仅是分析二维对应分析图。
技术领域
本发明涉及道路交通技术领域,尤其是一种基于多重对应和K-means聚类的交通事故成因分析方法。
背景技术
道路交通系统的构成要素包括人、车、道路、环境,每个要素自成子系统又相互作用,而交通事故的发生是由于各个子系统自身出现问题或相互间作用失调。通过对大量交通事故数据的研究,对道路安全提出针对性的干预手段或改善措施,以达到降低事故风险和减轻事故伤害严重程度的目的。
影响交通事故的潜在风险众多,包括交通参与者、车辆、道路和环境等。目前,现有研究主要关注驾驶者年龄、性别、驾龄等和危险驾驶行为。道路方面主要研究道路网络、道路设计、交通控制等对交通事故的影响。车辆安全研究主要包括主动安全方面的车辆智能防撞技术与被动安全方面的车辆安全设施的设计优化、车辆安全测试法规的制定和应用等。
当前,公安交通管理部门记录了大量的交通事故数据,但只是以采集到的数据为基础进行简单的分类统计说明,没有进行相关性分析,很难发现交通系统各要素对交通事故的综合影响,不能够详细的分析交通事故成因。
发明内容
本发明所要解决的技术问题在于,提供一种基于多重对应和K-means聚类的交通事故成因分析方法,能够根据聚类结果从多维度综合探究交通事故成因,不仅是分析二维对应分析图。
为解决上述技术问题,本发明提供一种基于多重对应和K-means聚类的交通事故成因分析方法,包括如下步骤:
(1)根据获取的交通事故数据集,选取影响交通事故发生的变量并分类;
(2)通过Mysql数据库统计各变量的类别数和相应事故数量,筛选合并异常值的变量类别,得到事故数据表;
(3)将得到的事故数据表处理得到二进制指标矩阵;
(4)将事故类型作为表征事故特征的变量进行多重对应分析,得到各变量类别的多重对应分析坐标;
(5)使用局部线性嵌入LLE算法对事故数据多重对应分析所得变量类别坐标进行降维,得到LLE降维坐标;
(6)使用K-means聚类算法对变量类别进行聚类,并根据聚类结果进行分析。
优选的,步骤(3)中,将得到的事故数据表处理得到二进制指标矩阵具体包括如下步骤:
(31)设选取的事故数据包括n起交通事故,共有p个数据字段(变量)每个字段的类别个数分别为k1,…,kj,…,kp,则数据集的类别总数为j=1,2,…,p,设变量j的类别l为jl;
(32)定义二进制指标矩阵的元素为i=1,2,…n;设Xjl与jl相关联,Xjl=[x1jl,…,xnjl],变量j的kj个类别构成与变量相关的二进制指标矩阵,n*kj项,对于所有的p个类别变量,通过横向连接得到整个数据集二进制指标矩阵X:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811150213.7/2.html,转载请声明来源钻瓜专利网。