[发明专利]基于海量公交数据的人群画像算法有效
申请号: | 202110365315.6 | 申请日: | 2021-04-06 |
公开(公告)号: | CN112800210B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 张锦;张建忠;魏叶华;罗迅;娄小平 | 申请(专利权)人: | 湖南师范大学 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F40/216;G06F40/30;G06F16/29 |
代理公司: | 长沙市护航专利代理事务所(特殊普通合伙) 43220 | 代理人: | 谢新苗 |
地址: | 410081 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 海量 公交 数据 人群 画像 算法 | ||
本发明提供了基于海量公交数据的人群画像算法,包括如下步骤:步骤S1、数据描述及预处理:获取公交车刷卡数据及POI数据,并进行预处理;步骤S2、筛选重点地区人群:通过PageRank算法提取出行次数多,且去热点地区次数频繁的乘客轨迹数据;步骤S3、轨迹文本化:根据POI数据获得乘客所在坐标的所属功能性,根据乘客轨迹数据与乘客所在坐标的所属功能性,获取得到每个乘客的文本轨迹数据;步骤S4、文本聚类:采用聚类算法对文本轨迹数据聚类,获得人群画像。本发明为城市规划、社会行为分析等多个应用领域提供数据支撑,方便城市资源的合理调度与建设,更好地帮助管理部门和城市建设者对城市建设和发展做出最优决策。
技术领域
本发明涉及人群画像技术领域,特别涉及基于海量公交数据的人群画像算法。
背景技术
现代公共交通技术利用先进的公交刷卡收费系统和公交刷卡信息数据库,同时每天记录着上百万条的公交出行数据。研究发现,充分挖掘和利用公交乘客的刷卡数据,可以准确地分析出城市中个人或群体的日常活动规律。这些规律既可以有效帮助解决城市中公交路线规划、公交公司车辆调度问题,又可以对城市规划、社会行为分析等多个应用领域提供数据支撑,方便城市资源的合理调度与建设,更好地帮助管理部门和城市建设者对城市建设和发展做出最优决策。
虽然针对公交车刷卡数据的分析已有多年研究,但大多数研究主要集中在识别或预测活动地点、出行方式挖掘。这些研究本质上是确定人们在一天中的特定时间出发和停留的地方——揭示其居住地、工作点和“第三个地方”。交通数据隐藏着用户的日常行为,当用户群体具有相似的运动轨迹,可以认为该群体具有相似的特征,该特征即为该群体的人群画像,但是目前研究城市人群画像的技术还相对较少。
发明内容
本发明提供了基于海量公交数据的人群画像算法,其目的是为了解决背景技术中城市人群画像的技术相对较少的技术问题。
为了达到上述目的,本发明提供的基于海量公交数据的人群画像算法包括如下步骤:
步骤S1、数据描述及预处理:获取公交车刷卡数据及POI数据,并进行预处理;
步骤S2、筛选重点地区人群:通过PageRank算法提取出行次数多,且去热点地区次数频繁的乘客轨迹数据;
步骤S3、轨迹文本化:根据POI数据获得乘客所在坐标的所属功能性,根据乘客轨迹数据与乘客所在坐标的所属功能性,获取得到每个乘客的文本轨迹数据;
步骤S4、文本聚类:采用聚类算法对文本轨迹数据聚类,获得人群画像。
优选地,所述步骤S1包括如下步骤:
步骤S11、获取公交车刷卡数据:获取特定时间特定区域的公交出行数据,包括每位乘客的ID、上下车刷卡时间、上下车地点的经纬度,以及每位乘客的年龄属性,得到不同年龄段每位乘客的出行轨迹数据;
步骤S12、获取POI数据:获取特定区域的POI数据;
步骤S13、公交出行数据预处理:将公交出行数据进行清洗、分类、剔除,获得不同年龄属性的刷卡数据;
步骤S14、POI数据预处理:将POI数据进行功能性划分,获得功能不同的各类POI数据;
优选地,所述步骤S13具体包括如下步骤:
步骤S131、清洗公交出行数据:对存在某些数据为空或数据字段偏移的数据进行数据规范化处理,依据上下文补充数据和删除无法获取信息的数据;
步骤S132、截取清洗后的公交车连续一周内所有的公交车刷卡数据,并且将这些数据按照工作日和休息日进行划分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南师范大学,未经湖南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110365315.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种充退磁方法、充退磁头及充退磁机
- 下一篇:压气机及其放气机构
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置