[发明专利]基于海量公交数据的人群画像算法有效
申请号: | 202110365315.6 | 申请日: | 2021-04-06 |
公开(公告)号: | CN112800210B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 张锦;张建忠;魏叶华;罗迅;娄小平 | 申请(专利权)人: | 湖南师范大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F40/216;G06F40/30;G06F16/29 |
代理公司: | 长沙市护航专利代理事务所(特殊普通合伙) 43220 | 代理人: | 谢新苗 |
地址: | 410081 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 海量 公交 数据 人群 画像 算法 | ||
1.基于海量公交数据的人群画像算法,其特征在于,包括如下步骤:
步骤S1、数据描述及预处理:获取公交车刷卡数据及POI数据,并进行预处理;
步骤S2、筛选重点地区人群:通过PageRank算法提取出行次数多,且去热点地区次数频繁的乘客轨迹数据;
步骤S3、轨迹文本化:根据POI数据获得乘客所在坐标的所属功能性,根据乘客轨迹数据与乘客所在坐标的所属功能性,获取得到每个乘客的文本轨迹数据;
步骤S4、文本聚类:采用聚类算法对文本轨迹数据聚类,获得人群画像;
所述步骤S2具体包括如下步骤:
步骤S21、根据各公交站点用户上下车频率,计算该站点的重要性数值;
步骤S22、根据用户经过的公交站点的重要性数值,计算用户轨迹的贡献率;
所述步骤S22具体包括如下步骤:
步骤S221、将成年人工作日的刷卡数据中的所有公交站点Mall和出行的轨迹带入站点重要性数值的计算公式中,得到该组刷卡数据的所有出行公交站点对应的重要性数值PR(Mall);
步骤S222、根据该组人群中每位乘客u出行经过的公交站点n,计算该名乘客轨迹的重要性数值之和,即,其中,PR(Ti)是地点Ti的重要性数值;
步骤S223、对该组刷卡数据经过调试设置一个阈值T,只有每位乘客轨迹的重要性数值之和大于该阈值,即S(u)T,才将该乘客的轨迹数据保存下来;保存下来的轨迹数据即为该组刷卡数据中轨迹贡献率高的乘客数据;
步骤S224、将剩下5组数据,即成年人休息日的刷卡数据、老年人工作日的刷卡数据、老年人休息日的刷卡数据、学生工作日的刷卡数据,学生休息日的刷卡数据,重复步骤S221-S223,最后共得到6组轨迹贡献度高的乘客数据。
2.根据权利要求1所述的基于海量公交数据的人群画像算法,其特征在于,所述步骤S1包括如下步骤:
步骤S11、获取公交车刷卡数据:获取特定时间特定区域的公交出行数据,包括每位乘客的ID、上下车刷卡时间、上下车地点的经纬度,以及每位乘客的年龄属性,得到不同年龄段每位乘客的出行轨迹数据;
步骤S12、获取POI数据:获取该特定区域的POI数据;
步骤S13、公交出行数据预处理:将公交出行数据进行清洗、分类、剔除,获得不同年龄属性的刷卡数据;
步骤S14、POI数据预处理:将POI数据进行功能性划分,获得功能不同的各类POI数据。
3.根据权利要求2所述的基于海量公交数据的人群画像算法,其特征在于,所述步骤S13具体包括如下步骤:
步骤S131、清洗公交出行数据:对存在某些数据为空或数据字段偏移的数据进行数据规范化处理,依据上下文补充数据和删除无法获取信息的数据;
步骤S132、截取清洗后的公交车连续一周内所有的公交车刷卡数据,并且将这些数据按照工作日和休息日进行划分;
步骤S133、将工作日和休息日的数据按照乘客年龄属性划分,得到的6组数据分别为:成年人工作日的刷卡数据、成年人休息日的刷卡数据、老年人工作日的刷卡数据、老年人休息日的刷卡数据、学生工作日的刷卡数据和学生休息日的刷卡数据;
步骤S134、将这6组数据中每日都有乘车记录且乘车次数至少为2次的乘客数据筛选出来,最终得到成年人乘客的刷卡数据、老年人乘客的刷卡数据和学生乘客的刷卡数据。
4.根据权利要求1所述的基于海量公交数据的人群画像算法,其特征在于,所述步骤S21中,站点重要性数值的计算公式为:
其中,PR(A)是地点A的重要性数值;Ti是指n个指向地点A中的第i个指向地点A的地点;n表示指向地点A的地点个数;PR(Ti)是地点Ti的重要性数值;C(Ti)是地点Ti的出度,也就是Ti指向其他地点的边的个数;d为阻尼系数,即在任意时刻乘客到达某地点后并继续出行的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南师范大学,未经湖南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110365315.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种充退磁方法、充退磁头及充退磁机
- 下一篇:压气机及其放气机构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置