[发明专利]一种利用社交媒体挖掘人类活动时空模式的方法在审
申请号: | 201710883260.1 | 申请日: | 2017-09-26 |
公开(公告)号: | CN107908636A | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 王艳东;高露妹;王腾 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06Q50/00 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 严彦 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 社交 媒体 挖掘 人类 活动 时空 模式 方法 | ||
1.一种利用社交媒体挖掘人类活动时空模式的方法,其特征在于,包括以下步骤:
步骤1,面向用户个体提取时空路径,并确定主要时空路径,包括以下子步骤,
步骤1.1,面向用户个体进行社交媒体数据提取;
步骤1.2,以每条社交媒体数据作为一个活动,以社交媒体数据的位置信息作为活动位置;
步骤1.3,根据社交媒体数据的时间信息将活动划分为不同的时间段,设有n个时间段;
步骤1.4,对每个时间段的活动分别进行聚类;
步骤1.5,根据聚类包含的活动位置点数量,计算每个时段中各个聚类的比重值;
步骤1.6,根据各个聚类的比重值,提取每个时段的代表性聚类;
步骤1.7,基于代表性聚类生成多条时空路径,生成方式为,在每个时段从代表性聚类中选择一个聚类,将所有时段的选择结果连接生成一条时空路径;
步骤1.8,计算步骤1.7所得每条时空路径的出现概率,确认主要时空路径;
步骤1.9,根据主要时空路径提取用户的日间稳定点和晚间稳定点;
步骤2,根据主要时空路径将用户划分为不同类别,包括以下子步骤,
步骤2.1,将各用户的主要时空路径从三维空间映射到二维空间,对任一条时空路径的映射实现如下,
以时空路径包含的每个聚类的中心作为聚类位置,聚类中心使用每个聚类的外接圆圆心;
把在预定时间段内的聚类位置的经纬度坐标取平均值,作为原点位置;
计算时空路径包含的各时段的聚类位置与原点位置的通勤距离;
以横轴为时间,纵轴为通勤距离将时空路径绘制到二维平面;
步骤2.2,将参与聚类的每条时空路径作为一个拥有n个维度的对象,每个维度为相应时段的通勤距离,对时空路径进行分类;
步骤2.3,通过不同类别用户的通勤距离获取各类别的时间模式特征和空间模式特征。
2.根据权利要求1所述利用社交媒体挖掘人类活动时空模式的方法,其特征在于:步骤1.4中,使用基于密度的DBSCAN聚类方法对每个时间段的活动分别进行聚类。
3.根据权利要求1所述利用社交媒体挖掘人类活动时空模式的方法,其特征在于:步骤1.3中,设每个时间段的长度为1小时,n=24。
4.根据权利要求1所述利用社交媒体挖掘人类活动时空模式的方法,其特征在于:步骤1.5中,计算每个时段中各个聚类的比重值,包括用聚类包含的活动位置点数量计算各聚类所占比重,计算公式如下,
其中,P(j)t指第t个时间段第j个聚类所占比重,nj指第t个时段第j个类所包含的活动位置点数,N指该时段所有的活动位置点数。
5.根据权利要求1所述利用社交媒体挖掘人类活动时空模式的方法,其特征在于:步骤1.8中,计算每条路径出现概率,公式如下,
其中,代表该用户个体第k条时空路径的出现概率,p(j)t代表第t个时间窗口内的第j个聚类所占的比重。
6.根据权利要求1所述利用社交媒体挖掘人类活动时空模式的方法,其特征在于:步骤2.1中,预定时间段为1:00-6:00。
7.根据权利要求1所述利用社交媒体挖掘人类活动时空模式的方法,其特征在于:步骤2.2中,在n维空间中使用K-Means方法对时空路径进行分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710883260.1/1.html,转载请声明来源钻瓜专利网。