[发明专利]一种地铁与公共自行车刷卡数据融合方法在审
申请号: | 201810285795.3 | 申请日: | 2018-04-03 |
公开(公告)号: | CN108664553A | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 赵德;王炜;武丽佳;季彦婕;屠雨;梁鸣璋 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210096 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 刷卡数据 公共自行车 关联规则 地铁 交易数据 融合 运算速度快 交通数据 人工调查 数据基础 有效关联 支持度 置信度 准确率 多源 剔除 挖掘 检验 研究 | ||
1.一种地铁与公共自行车刷卡数据融合方法,其特征在于,包括以下步骤:
S1、获取地铁刷卡数据和公共自行车刷卡数据,并对公共自行车刷卡数据进行扩充;
S2、对地铁刷卡数据和扩充后公共自行车刷卡数据进行处理,生成交易数据;
S3、基于交易数据,计算地铁IC卡与公共自行车IC卡的关联规则的支持度、置信度与提升度;
S4、提取有效关联规则,生成关联规则列表。
2.根据权利要求1所述的一种地铁与公共自行车刷卡数据融合方法,其特征在于,所述步骤S1中提取相同时间段内地铁刷卡数据和公共自行车刷卡数据,地铁刷卡数据包括5列,分别为地铁卡编号、进站地铁站编号、进站时间、出站地铁站编号和出站时间;公共自行车刷卡数据包括5列,分别为公共自行车卡编号、租车站编号、租车时间、还车站编号和还车时间;对公共自行车刷卡数据进行扩充,增加2列数据,分别为租车站临近的地铁站编号与还车站临近的地铁站编号。
3.根据权利要求2所述的一种地铁与公共自行车刷卡数据融合方法,其特征在于,所述租车站临近的地铁站编号为公共自行车租车站指定半径范围内最近的地铁站编号,所述还车站临近的地铁站编号为公共自行车还车站指定半径范围内最近的地铁站编号。
4.根据权利要求3所述的一种地铁与公共自行车刷卡数据融合方法,其特征在于,所述指定半径为300m。
5.根据权利要求1所述的一种地铁与公共自行车刷卡数据融合方法,其特征在于,所述步骤S2中利用地铁刷卡数据库和公共自行车刷卡数据库生成交易数据的方法如下:
分别根据进站时间和还车时间以一定时间间隔将数据划分为一个个子集,然后,在地铁刷卡数据库和公共自行车刷卡数据库同一时间段的子集中,筛选“进站地铁站编号”与“还车站临近的地铁站编号”相同的数据行,提取“地铁IC卡编号”与“公共自行车IC卡编号”组成一条交易;
分别根据出站时间和租车时间以一定时间间隔将数据划分为一个个子集,然后,在地铁刷卡数据库和公共自行车刷卡数据库同一时间段的子集中,筛选“出站地铁站编号”与“租车站临近的地铁站编号”相同的数据行,提取“地铁IC卡编号”与“公共自行车IC卡编号”组成一条交易;
将上述两类方法中生成的逐条交易,按行记录,组成交易数据。
6.根据权利要求1所述的一种地铁与公共自行车刷卡数据融合方法,其特征在于,所述步骤S3具体包括以下步骤:
S31、计算每个地铁IC卡编号与每个公共自行车IC卡编号的支持度,公式如下:
地铁IC卡支持度:
公共自行车IC卡支持度:
其中,num(i)为地铁IC卡i在交易数据中出现的次数,num(j)为公共自行车IC卡j在交易数据中出现的次数,num(D)为交易数据的总行数;
S32、计算关联规则的支持度,公式如下:
其中,为地铁IC卡i到公共自行车IC卡j关联规则的支持度,num(i∪j)为地铁IC卡i和公共自行车的IC卡j同时在交易数据中出现的次数;
S33、计算关联规则的置信度,公式如下:
其中,为地铁IC卡i到公共自行车IC卡j关联规则的置信度;
S34、计算关联规则的提升度,公式如下:
其中,为地铁IC卡i到公共自行车IC卡j关联规则的提升度。
7.根据权利要求1所述的一种地铁与公共自行车刷卡数据融合方法,其特征在于,所述步骤S4中有效关联规则为支持度大于0.00055、置信度大于0.4并且提升度大于10的关联规则。
8.根据权利要求1所述的一种地铁与公共自行车刷卡数据融合方法,其特征在于,还包括对每一条关联规则进行检验的步骤,所述检验利用从交易数据中预留的一部分检测数据集完成,若关联规则可以通过所有检验条件,则保留该关联规则;若关联规则未通过所有检验条件,则从关联规则列表中剔除。
9.根据权利要求8所述的一种地铁与公共自行车刷卡数据融合方法,其特征在于,所述检验条件包含:
(1)在检测数据集中存在匹配的两个IC卡的换乘行为;
(2)在检测数据集中匹配的两个IC卡刷卡记录之间没有观察到时间重叠;
(3)一个地铁IC卡编号i只与一个公共自行车IC卡编号j相匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810285795.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用户偏好挖掘方法及装置
- 下一篇:一种应用程序中加载网页视图的方法及装置