[发明专利]一种基于半监督学习的道路交通状态判别方法无效

专利信息
申请号: 201410135031.8 申请日: 2014-04-04
公开(公告)号: CN103903441A 公开(公告)日: 2014-07-02
发明(设计)人: 孙占全;赵彦玲;顾卫东;张新常 申请(专利权)人: 山东省计算中心
主分类号: G08G1/01 分类号: G08G1/01;G08G1/065;G06K9/66
代理公司: 济南泉城专利商标事务所 37218 代理人: 褚庆森
地址: 250014 山东省济南市高新区新*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 监督 学习 道路交通 状态 判别 方法
【说明书】:

技术领域

发明涉及一种基于半监督学习的道路交通状态判别方法,更具体的说,尤其涉及一种首先利用有标记的交通流数据对基分类器进行训练然后再利用无标记的交通流数据进行协同训练的基于半监督学习的道路交通状态判别方法。 

背景技术

随着城市的迅速发展,交通拥堵、交通污染日益严重,交通尾气排放是目前雾霾的主要污染源之一。这些都是各大城市亟待解决的问题,智能交通成为改善城市交通的关键所在。近年来,各大、中城市的智能交通系统不断完善,智能化程度不断提高,交通数据采集的范围、广度和深度急剧增加,正在形成以线圈、微波、GPS、车牌等交通流检测数据,交通监控视频数据,以及系统数据和服务数据等为主体的海量交通数据,这为道路交通状态判别提供了更加丰富的信息。道路交通状态需要通过对采集交通流数据分析得到判别结果,道路交通状态无法通过采集设备直接获取。因此,采集的大量交通流数据都是无标记样本,道路交通状态的样本需要通过人为判别进行标注,耗费大量的人力物力,要获取大量有标记的道路交通状态样本非常困难。

交通状态判别是智能交通系统的重要研究内容,已有大量的研究成果,很多数据挖掘方法被用于交通状态的自动判别,如支持向量机、BP神经网络、决策树、K-最近邻分类方法、贝叶斯神经网络等。虽然如此,仍有很多交通状态判别方法很难在实际中应用,主要原因是这些有监督的交通状态判别方法需要大量的训练样本,而实际中很难采集大量的交通状态样本,因此限制了很多数据挖掘方法在实际交通状态判别中的应用。

如果只使用少量的有标记样本,那么利用它们所训练出的学习系统往往很难具有强泛化能力;另一方面,如果仅使用少量“昂贵的”有标记样本而不利用大量“廉价的”未标记样本,则是对数据资源的极大的浪费。如果大规模交通流数据被充分利用,必将提高交通状态判别的正确率,但常规的交通状态判别方法的计算量随着样本量的增长呈指数级增长。半监督学习是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法,利用少量有标签数据训练初始分类器,同时用大量无标签数据来进一步改进初始分类器的性能以最终达到精确学习的一种综合学习方法,它可有效解决少量标注样本和大量未标注样本的分类问题。 

发明内容

本发明为了克服上述技术问题,提供了一种基于半监督学习的道路交通状态判别方法。

本发明的基于半监督学习的道路交通状态判别方法,其特别之处在于,包括以下步骤:a).采集交通流数据,采集道路及其上游路口、下游路口的交通流数据,所采集的交通流数据包括交通流量                                               、时间占有率和车辆速度;设时刻待预测道路上的交通流数据分别为、、,上游路口、下游路口的交通流数据分别为、、和、、,其中:,为所采集的交通流数据的数目; b).人工标记样本,通过人工观察视频监测数据或现场观察的方式,对步骤a)中采集的部分道路交通流数据对应的交通状态进行标注,生成个交通状态,由此生成训练测试样本集,样本集表示为:

其中,时刻交通流样本参数为:

交通状态取值为畅通、拥挤或堵塞,;为判断时刻道路交通状态所需的历史采样时间点个数;c).生成标记训练集,从样本集中随机有放回地抽取个样本,形成一个有标记训练集,≤;d).重复生成标记训练集,采用与步骤c)中相同的方法,再形成两个有标记的训练集、,训练集和的样本数也均为;e).训练基分类器,选择3种基分类器,利用训练集、、分别对3种基分类器进行训练;训练方法为:将当前道路的交通流样本输入参数、上游及下游路口的交通流样本输入和综合起来作为各基分类器的输入,用表示,交通状态作为各分类器的输出,对基分类器进行训练,形成训练后的基分类器;f).选取未标记样本,从未经人工标记交通状态的交通流数据中选取个样本,以便对3个基分类器进行协同训练;g).协同训练基分类器,如果任意两个训练后的基分类器对同一个未标记样本的输入参数所预测的交通状态结果相同,则表明该样本具有较高的标识置信度,对该样本标记后加入第三个基分类器的有标记训练集,形成新的训练集,并对第三个分类器重新进行训练;如果3个分类器对同一样本的预测一致,则将该样本标记后,各基分类器均不变;如果3个分类器对同一样本的预测结果均不相同,则对该样本不做标记,各基分类器均不变;h).重复执行步骤g),直至个未经人工标记样本全部参与协同训练,以使3个基分类器不再有变化,协同训练过程结束。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心,未经山东省计算中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410135031.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top