[发明专利]基于海量公交数据的人群画像算法有效

专利信息
申请号: 202110365315.6 申请日: 2021-04-06
公开(公告)号: CN112800210B 公开(公告)日: 2021-06-18
发明(设计)人: 张锦;张建忠;魏叶华;罗迅;娄小平 申请(专利权)人: 湖南师范大学
主分类号: G06F16/335 分类号: G06F16/335;G06F16/35;G06F40/216;G06F40/30;G06F16/29
代理公司: 长沙市护航专利代理事务所(特殊普通合伙) 43220 代理人: 谢新苗
地址: 410081 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 海量 公交 数据 人群 画像 算法
【权利要求书】:

1.基于海量公交数据的人群画像算法,其特征在于,包括如下步骤:

步骤S1、数据描述及预处理:获取公交车刷卡数据及POI数据,并进行预处理;

步骤S2、筛选重点地区人群:通过PageRank算法提取出行次数多,且去热点地区次数频繁的乘客轨迹数据;

步骤S3、轨迹文本化:根据POI数据获得乘客所在坐标的所属功能性,根据乘客轨迹数据与乘客所在坐标的所属功能性,获取得到每个乘客的文本轨迹数据;

步骤S4、文本聚类:采用聚类算法对文本轨迹数据聚类,获得人群画像;

所述步骤S2具体包括如下步骤:

步骤S21、根据各公交站点用户上下车频率,计算该站点的重要性数值;

步骤S22、根据用户经过的公交站点的重要性数值,计算用户轨迹的贡献率;

所述步骤S22具体包括如下步骤:

步骤S221、将成年人工作日的刷卡数据中的所有公交站点Mall和出行的轨迹带入站点重要性数值的计算公式中,得到该组刷卡数据的所有出行公交站点对应的重要性数值PR(Mall);

步骤S222、根据该组人群中每位乘客u出行经过的公交站点n,计算该名乘客轨迹的重要性数值之和,即,其中,PR(Ti)是地点Ti的重要性数值;

步骤S223、对该组刷卡数据经过调试设置一个阈值T,只有每位乘客轨迹的重要性数值之和大于该阈值,即S(u)T,才将该乘客的轨迹数据保存下来;保存下来的轨迹数据即为该组刷卡数据中轨迹贡献率高的乘客数据;

步骤S224、将剩下5组数据,即成年人休息日的刷卡数据、老年人工作日的刷卡数据、老年人休息日的刷卡数据、学生工作日的刷卡数据,学生休息日的刷卡数据,重复步骤S221-S223,最后共得到6组轨迹贡献度高的乘客数据。

2.根据权利要求1所述的基于海量公交数据的人群画像算法,其特征在于,所述步骤S1包括如下步骤:

步骤S11、获取公交车刷卡数据:获取特定时间特定区域的公交出行数据,包括每位乘客的ID、上下车刷卡时间、上下车地点的经纬度,以及每位乘客的年龄属性,得到不同年龄段每位乘客的出行轨迹数据;

步骤S12、获取POI数据:获取该特定区域的POI数据;

步骤S13、公交出行数据预处理:将公交出行数据进行清洗、分类、剔除,获得不同年龄属性的刷卡数据;

步骤S14、POI数据预处理:将POI数据进行功能性划分,获得功能不同的各类POI数据。

3.根据权利要求2所述的基于海量公交数据的人群画像算法,其特征在于,所述步骤S13具体包括如下步骤:

步骤S131、清洗公交出行数据:对存在某些数据为空或数据字段偏移的数据进行数据规范化处理,依据上下文补充数据和删除无法获取信息的数据;

步骤S132、截取清洗后的公交车连续一周内所有的公交车刷卡数据,并且将这些数据按照工作日和休息日进行划分;

步骤S133、将工作日和休息日的数据按照乘客年龄属性划分,得到的6组数据分别为:成年人工作日的刷卡数据、成年人休息日的刷卡数据、老年人工作日的刷卡数据、老年人休息日的刷卡数据、学生工作日的刷卡数据和学生休息日的刷卡数据;

步骤S134、将这6组数据中每日都有乘车记录且乘车次数至少为2次的乘客数据筛选出来,最终得到成年人乘客的刷卡数据、老年人乘客的刷卡数据和学生乘客的刷卡数据。

4.根据权利要求1所述的基于海量公交数据的人群画像算法,其特征在于,所述步骤S21中,站点重要性数值的计算公式为:

其中,PR(A)是地点A的重要性数值;Ti是指n个指向地点A中的第i个指向地点A的地点;n表示指向地点A的地点个数;PR(Ti)是地点Ti的重要性数值;C(Ti)是地点Ti的出度,也就是Ti指向其他地点的边的个数;d为阻尼系数,即在任意时刻乘客到达某地点后并继续出行的概率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南师范大学,未经湖南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110365315.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top