[发明专利]一种基于波动率的通勤出行模式识别方法有效
申请号: | 202010872239.3 | 申请日: | 2020-08-26 |
公开(公告)号: | CN111860699B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 安奎霖;杨梦宁;曹景南;王明宸;王壮壮 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/04;G06Q50/30;G06F17/11 |
代理公司: | 重庆晟轩知识产权代理事务所(普通合伙) 50238 | 代理人: | 王海凤 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 波动 通勤 出行 模式识别 方法 | ||
1.一种基于波动率的通勤出行模式识别方法,其特征在于,包括如下步骤:
S10:进行城市区域划分;
S11:通过城市现有的行政和功能区域划分聚类个数和聚类范围:取所有n个研究对象站点x作为聚类数据集Ω,Ω={x1,x2,x3……xn};
将所有研究对象站点分别归类到k个站点区域集合Θi中,Θi={xi,1,xi,2,xi,3……},i∈{1,2,3,4…,k};
S12:使用K-means算法进行聚类,随机选择聚类中心,针对聚类数据集Ω中的每个站点,计算每个站点到各个聚类中心点的影响距离确定站点xi到哪个聚类中心的影响距离最小,就将站点xi划分到该聚类中心的类中,输出聚类中心和各个类中的所有站点;
所述S12随机选择聚类中心的方法为:
1)从聚类数据集Ω中随机选取一个站点作为初始聚类中心C1,通过公式(1)计算站点xi与聚类中心点Cj的欧氏距离通过公式(2)计算站点xi被选为下一个聚类中心点的概率P(xi);
其中,k是坐标参数维度,xi,k和cj,k分别表示站点xi与聚类中心点Cj的第k维数据;
2)按照每一个站点xi的P(xi)的大小确定每一个站点的轮盘面积,再使用轮盘法选取下一个聚类中心,每次选取下一个聚类中心后将同属于一个Θi的xi从轮盘中删除,依次选出k个聚类中心作为聚类中心点集Φ,Φ={c1,c2,c3…ct…ck};
所述S12中计算每个站点到各个聚类中心点的影响距离的方法为:
Ⅰ)使用公式(3)计算每个非聚类中心站点到聚类中心的欧氏距离均值Si作为欧氏距离特征值;
使用公式(4)计算每个非聚类中心站点对研究聚类中心预设区域的所属特征值Ri;
Ⅱ)分别使用公式(5)和公式(6)对求得的Si和Ri进行归一化计算得到S′i和R′i;
Ⅲ)分别使用公式(7)和公式(8)计算当前研究聚类中心S和R的熵值eS和eR;
其中,Si和Ri是两个计算中间值,无实际含义,Si和Ri分别通过公式(9)和公式(10)计算得到;
Ⅳ)分别使用公式(11)和公式(12)计算当前研究聚类中心S和R的信息熵冗余度dS和dR;
dS=1-eS(11);
dR=1-eR(12);
Ⅴ)分别使用公式(13)和公式(14)计算当前研究聚类中心S和R的信息熵权重wS和wR;
Ⅵ )重复Ⅰ)-Ⅴ)的计算过程求得k个聚类中心的信息熵权重wS,i和wR,i;
Ⅶ )使用K-means聚类算法进行聚类操作,使用公式(15)计算每个站点到各个聚类中心点的影响距离
S20:通勤出行模式识别;
S21:每个聚类中心和该聚类中心的所有站点构成一个研究对象区域,两个研究对象区域组成的一组研究对象区域;
对一组研究对象区域随机抽取若干个工作日的每小时客流统计数据ai,24个小时的客流数据组成数据集Ψ,Ψ={a1,a2,a3…a24};
S22:分别计算24-n个客流波动率si,检索24-n个客流波动率si,计数大于阈值的波动率个数q:
若q=4且四个波动率峰值分别对应早高峰和晚高峰的起止时间点,那么这一组研究对象区域被识别为通勤出行模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010872239.3/1.html,转载请声明来源钻瓜专利网。