[发明专利]一种基于地铁刷卡数据的通学识别方法有效
申请号: | 201711043136.0 | 申请日: | 2017-10-31 |
公开(公告)号: | CN107818415B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 季彦婕;顾宇;刘阳;刘攀 | 申请(专利权)人: | 东南大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/20;G06Q50/30;G07C9/20;G07B15/04 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210096 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 地铁 刷卡 数据 通学 识别 方法 | ||
1.一种基于地铁刷卡数据的通学识别方法,其特征在于,该方法包括以下步骤:
(1)采集一定时间段内各地铁站点的IC卡刷卡数据和地铁站点坐标数据,对原始刷卡数据进行预处理,剔除无效数据;
(2)为每个卡号计算出该卡号所有车站的出现频次,找出其中出现频次最高的车站,并统计每个卡号的出现频次最高的车站的数量;
(3)根据出现频次最高的车站的数量,找出每个卡号的家车站和学校车站的候选车站,具体包括:
(31)判断每个卡号出现频次最高的车站的数量,若该车站数为1,则对应的车站为该卡号的候选车站Si1;若车站数为2,则对应的两个车站分别为该卡号的候选车站Si1和Si2;若车站数大于2,则将相距不超过指定阈值的站点合并,再令频次最高的车站为Si1,若合并后频次最高的车站数为2,则对应的两个车站分别为该卡号的候选车站Si1和Si2,若合并后频次最高的车站数仍大于2,则删除该卡号及相应记录;
(32)对于步骤(31)中只找出一个候选车站Si1的卡号,计算与候选车站Si1对应的车站出现的频次,根据出现频次最高的对应车站的数量找出家车站或学校车站的另一个候选车站Si2:若对应车站中出现频次最高的车站数量为1,则该车站为该卡号的另一个候选车站Si2;若对应车站中出现频次最高的车站数量大于或等于2,将相距不超过指定阈值的站点合并,然后令频次最高的车站为Si2,若合并后仍有并列则删除该卡号及相应记录;
(4)根据中小学作息时间安排,将所有卡号候选车站之间的出行记录按照进站时间分为若干类别;
(5)针对落入各个类别中的出行记录,根据最早或最晚进站时间确定家车站和学校车站,从而得到通学出行记录。
2.根据权利要求1所述的一种基于地铁刷卡数据的通学识别方法,其特征在于,所述步骤(1)中的原始刷卡数据包括:卡号、进站日期、进站时间、出站日期、出站时间、进站车站号、出站车站号、卡类型。
3.根据权利要求2所述的一种基于地铁刷卡数据的通学识别方法,其特征在于,所述步骤(1)中对原始数据预处理包括:只保留卡类型为学生卡并且进站日期属于工作日的记录,并删除进站车站号和出站车站号相同以及进站日期和出站日期不同的异常数据。
4.根据权利要求1所述的一种基于地铁刷卡数据的通学识别方法,其特征在于,所述步骤(1)中一定时间段的时长不低于三周。
5.根据权利要求1所述的一种基于地铁刷卡数据的通学识别方法,其特征在于,所述步骤(4)中出行类别包括:
am:进站时间在上午最晚上学时间之前;
pm:进站时间在下午最早放学时间之后;
noon1:进站时间在上午最早放学时间至下午最早上学时间范围之内;
noon2:进站时间在下午最早上学时间至下午最晚上学时间范围之内。
6.根据权利要求5所述的一种基于地铁刷卡数据的通学识别方法,其特征在于,所述步骤(5)包括:对四个类别分别按照卡号、进站时间排序;对于存在出行记录属于am的卡号,将其第一条出行记录的进站车站号确定为家车站,对应的出站车站号为学校车站;对于存在出行记录属于pm的卡号,将最后一条出行记录的出站车站号确定为家车站,对应的进站车站号为学校车站;对于存在出行记录属于noon1的卡号,将第一条出行记录的进站车站号确定为学校车站,对应的出站车站号为家车站;对于存在出行记录属于noon2的卡号,将最后一条出行记录的出站车站号确定为学校车站,对应的进站车站号为家车站。
7.根据权利要求1所述的一种基于地铁刷卡数据的通学识别方法,其特征在于,还包括:根据中小学作息时间安排,在所有被识别出家车站和学校车站的卡号的出行记录中删除上午最晚上学时间之前从学校车站出发的记录以及下午最晚放学时间之后从家车站出发的记录。
8.根据权利要求1所述的一种基于地铁刷卡数据的通学识别方法,其特征在于,还包括:删除通学天数少于指定阈值天数的卡号及其出行记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711043136.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置