[发明专利]一种地铁与公共自行车刷卡数据融合方法在审
申请号: | 201810285795.3 | 申请日: | 2018-04-03 |
公开(公告)号: | CN108664553A | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 赵德;王炜;武丽佳;季彦婕;屠雨;梁鸣璋 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210096 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 刷卡数据 公共自行车 关联规则 地铁 交易数据 融合 运算速度快 交通数据 人工调查 数据基础 有效关联 支持度 置信度 准确率 多源 剔除 挖掘 检验 研究 | ||
本发明公开了一种地铁与公共自行车刷卡数据的融合方法,属于多源交通数据挖掘领域。该方法包括以下步骤:S1、获取地铁刷卡数据和公共自行车刷卡数据,并对公共自行车刷卡数据进行扩充;S2、对地铁刷卡数据和扩充后公共自行车刷卡数据进行处理,生成交易数据;S3、基于交易数据,计算地铁IC卡与公共自行车IC卡的关联规则的支持度、置信度与提升度;S4、提取有效关联规则,生成关联规则列表;S5、对关联规则列表进行检验,剔除不合理的关联规则。本发明方法对地铁与公共自行车刷卡数据进行融合的准确率高达97%,能够为进一步的研究提供数据基础,同时该方法运算速度快,相比于人工调查方式,不仅减少了人力投入,而且降低了误差。
技术领域
本发明涉及多源交通数据的融合方法,具体涉及一种地铁与公共自行车刷卡数据融合方法。
背景技术
交通大数据日新月异,近几年也迅速积累,这为交通研究者提供了大量的数据基础,可以研究居民的出行特征,诊断交通堵塞点并采取相应的措施,从而为居民的日常交通提供更加便捷的服务。然而,目前交通数据多源纷杂,不同运营商提供的交通数据难以相互融合,这为数据的解析与利用带来了极大的困扰。尤其是,中国大城市的地铁卡与公共自行车卡,拥有着巨大的利用潜能,但是同一个出行者的地铁卡与公共自行车卡难以关联。
地铁和公共自行车的IC卡往往由两家独立的公司发行和管理。在大多数情况下,用户必须持有两张卡才能完成公共自行车和地铁之间的出行链。因此,地铁IC卡数据集和公共自行车IC卡数据集被独立保存,没有共同的ID记录同一个人。研究人员很难利用IC卡数据来有效地调查地铁和自行车的换乘行为,除非卡ID能够匹配。但唯一可以关联两张卡的个人身份信息为用户隐私,难以向研究者或管理者公开。因此目前亟需一种数据融合方法来匹配同一个人的地铁和公共自行车IC卡。
发明内容
发明目的:针对现有技术中的问题,本发明提出一种不涉及用户隐私信息、高效率的地铁与公共自行车刷卡数据融合方法。
技术方案:本发明所述的一种地铁与公共自行车刷卡数据融合方法,包括如下的步骤:S1、获取地铁刷卡数据和公共自行车刷卡数据,并对公共自行车刷卡数据进行扩充;S2、对地铁刷卡数据和扩充后公共自行车刷卡数据进行处理,生成交易数据;S3、基于交易数据,计算地铁IC卡与公共自行车IC卡的关联规则的支持度、置信度与提升度;S4、提取有效关联规则,生成关联规则列表。
其中,步骤S1中提取30天以上的地铁刷卡数据和公共自行车刷卡数据,地铁刷卡数据包括5列,分别为地铁卡编号、进站地铁站编号、进站时间、出站地铁站编号和出站时间;公共自行车刷卡原始数据包括5列,分别为公共自行车卡编号、租车站编号、租车时间、还车站编号和还车时间。对公共自行车刷卡数据进行扩充,增加2列数据,该2列数据分别为租车站临近的地铁站编号与还车站临近的地铁站编号,最终生成7列的扩充后公共自行车刷卡数据。
步骤S2中利用地铁刷卡数据库和公共自行车刷卡数据库生成交易数据的方法如下:
分别根据进站时间和还车时间以一定时间间隔将数据划分为一个个子集,然后,在地铁刷卡数据库和公共自行车刷卡数据库同一时间段的子集中,筛选“进站地铁站编号”与“还车站临近的地铁站编号”相同的数据行,提取“地铁IC卡编号”与“公共自行车IC卡编号”组成一条交易;
分别根据出站时间和租车时间以一定时间间隔将数据划分为一个个子集,然后,在地铁刷卡数据库和公共自行车刷卡数据库同一时间段的子集中,筛选“出站地铁站编号”与“租车站临近的地铁站编号”相同的数据行,提取“地铁IC卡编号”与“公共自行车IC卡编号”组成一条交易;
将上述两类方法中生成的逐条交易,按行记录,组成交易数据。
进一步地,步骤S3具体包括以下步骤:
S31、计算每个地铁IC卡编号与每个公共自行车IC卡编号的支持度,公式如下:
地铁IC卡支持度:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810285795.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用户偏好挖掘方法及装置
- 下一篇:一种应用程序中加载网页视图的方法及装置