[发明专利]基于海量公交数据的人群画像算法有效

专利信息
申请号: 202110365315.6 申请日: 2021-04-06
公开(公告)号: CN112800210B 公开(公告)日: 2021-06-18
发明(设计)人: 张锦;张建忠;魏叶华;罗迅;娄小平 申请(专利权)人: 湖南师范大学
主分类号: G06F16/335 分类号: G06F16/335;G06F16/35;G06F40/216;G06F40/30;G06F16/29
代理公司: 长沙市护航专利代理事务所(特殊普通合伙) 43220 代理人: 谢新苗
地址: 410081 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 海量 公交 数据 人群 画像 算法
【说明书】:

发明提供了基于海量公交数据的人群画像算法,包括如下步骤:步骤S1、数据描述及预处理:获取公交车刷卡数据及POI数据,并进行预处理;步骤S2、筛选重点地区人群:通过PageRank算法提取出行次数多,且去热点地区次数频繁的乘客轨迹数据;步骤S3、轨迹文本化:根据POI数据获得乘客所在坐标的所属功能性,根据乘客轨迹数据与乘客所在坐标的所属功能性,获取得到每个乘客的文本轨迹数据;步骤S4、文本聚类:采用聚类算法对文本轨迹数据聚类,获得人群画像。本发明为城市规划、社会行为分析等多个应用领域提供数据支撑,方便城市资源的合理调度与建设,更好地帮助管理部门和城市建设者对城市建设和发展做出最优决策。

技术领域

本发明涉及人群画像技术领域,特别涉及基于海量公交数据的人群画像算法。

背景技术

现代公共交通技术利用先进的公交刷卡收费系统和公交刷卡信息数据库,同时每天记录着上百万条的公交出行数据。研究发现,充分挖掘和利用公交乘客的刷卡数据,可以准确地分析出城市中个人或群体的日常活动规律。这些规律既可以有效帮助解决城市中公交路线规划、公交公司车辆调度问题,又可以对城市规划、社会行为分析等多个应用领域提供数据支撑,方便城市资源的合理调度与建设,更好地帮助管理部门和城市建设者对城市建设和发展做出最优决策。

虽然针对公交车刷卡数据的分析已有多年研究,但大多数研究主要集中在识别或预测活动地点、出行方式挖掘。这些研究本质上是确定人们在一天中的特定时间出发和停留的地方——揭示其居住地、工作点和“第三个地方”。交通数据隐藏着用户的日常行为,当用户群体具有相似的运动轨迹,可以认为该群体具有相似的特征,该特征即为该群体的人群画像,但是目前研究城市人群画像的技术还相对较少。

发明内容

本发明提供了基于海量公交数据的人群画像算法,其目的是为了解决背景技术中城市人群画像的技术相对较少的技术问题。

为了达到上述目的,本发明提供的基于海量公交数据的人群画像算法包括如下步骤:

步骤S1、数据描述及预处理:获取公交车刷卡数据及POI数据,并进行预处理;

步骤S2、筛选重点地区人群:通过PageRank算法提取出行次数多,且去热点地区次数频繁的乘客轨迹数据;

步骤S3、轨迹文本化:根据POI数据获得乘客所在坐标的所属功能性,根据乘客轨迹数据与乘客所在坐标的所属功能性,获取得到每个乘客的文本轨迹数据;

步骤S4、文本聚类:采用聚类算法对文本轨迹数据聚类,获得人群画像。

优选地,所述步骤S1包括如下步骤:

步骤S11、获取公交车刷卡数据:获取特定时间特定区域的公交出行数据,包括每位乘客的ID、上下车刷卡时间、上下车地点的经纬度,以及每位乘客的年龄属性,得到不同年龄段每位乘客的出行轨迹数据;

步骤S12、获取POI数据:获取特定区域的POI数据;

步骤S13、公交出行数据预处理:将公交出行数据进行清洗、分类、剔除,获得不同年龄属性的刷卡数据;

步骤S14、POI数据预处理:将POI数据进行功能性划分,获得功能不同的各类POI数据;

优选地,所述步骤S13具体包括如下步骤:

步骤S131、清洗公交出行数据:对存在某些数据为空或数据字段偏移的数据进行数据规范化处理,依据上下文补充数据和删除无法获取信息的数据;

步骤S132、截取清洗后的公交车连续一周内所有的公交车刷卡数据,并且将这些数据按照工作日和休息日进行划分;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南师范大学,未经湖南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110365315.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top