[发明专利]一种基于手机信令数据的断面客流计算方法有效
申请号: | 201911119105.8 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110913345B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 张奇;刘芷辰;刘志远;付晓 | 申请(专利权)人: | 东南大学 |
主分类号: | H04W4/029 | 分类号: | H04W4/029;H04W64/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王安琪 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 手机 数据 断面 客流 计算方法 | ||
1.一种基于手机信令数据的断面客流计算方法,其特征在于,包括如下步骤:
(1)从手机信令数据中提取原始基站轨迹序列,每一个轨迹点包含基站地理位置坐标和时间戳,利用混合降噪算法以处理轨迹的空间不确定性问题;具体为:
由三个过程组成的混合过滤算法来解决手机信令数据定位中的两种空间不确定性问题:定位误差和振荡;混合过滤算法以应用于过程1利用时间阈值以过滤不可靠轨迹点开始,过程2删除定位错误产生的无意义轨迹点,过程3通过去除复杂的振荡模式来平滑基站轨迹;
过程1:时间阈值处理;
手机信令数据指手机信令数据,每一条数据中包含客户端ID、客户端连接的基站编号,该基站的位置和数据产生的时间戳;定义基站元胞为基站所覆盖的服务面积,用泰森多边形进行表示,且位于该基站所属的泰森多边形内的任意点至该基站的距离要小于至其他基站的距离;bi表示基站,ci表示该基站对应到基站元胞,位于基站bi服务面积内的一点表示为pinci,如果基站元胞ci和基站元胞cj有公共边,则认为bi和bj相邻,如下式(1)中,手机信令数据集中的一条数据由客户端在该点所连接基站的坐标和对应的时间戳表示;
dn=(xn,yn,tn) (1)
式中dn代表轨迹中第n个轨迹点,(xn,yn)是客户端在该点所连接基站bn的坐标,tn是该客户端进入基站bn所对应的基站元胞cn范围内的时间戳,基站轨迹由轨迹点序列表示;
Tram={d1,d2,...,dn} (2)
式中Tram表示客户端m的基站轨迹;
基站轨迹序列Tram中记录的基站序列表示为Basem,对应的基站元胞序列表示为Cellm,基站对(bi,bi+1)表示基站序列Basem中的一对连续基站,如果所有的轨迹内的基站Basem都与其下一个基站相邻,则该基站轨迹Tram被认为是连续的;
过程1利用原始手机信令数据中的时间信息,考虑到时间不确定问题通常发生在较短的时间内,因此认为在基站停留时间长的数据点有更高的可信度,即停留时间小于时间阈值的轨迹点不能反应客户端的真实位置,对上述点进行删除,单个轨迹点的停留时间阈值按照下式计算;
durn=tn+1-tn (3)
式中,durn代表第
过程2:基于时间窗口的聚类算法;
基于时间窗口的聚类算法能处理小空间范围内手机信令数据定位错误的问题,使用长度n1=3的滑动窗口,窗口中覆盖的轨迹点构成三角形,利用公式(4)计算三角形的重心;
式中,pc代表三角形的重心,(xc,yc)表示三角形重心pc的坐标,(xi,yi)表示位于滑动窗口内轨迹点的坐标;
如果滑动窗口内所有的轨迹点均符合公式(5),则认为滑动窗口内所有的轨迹点可以被聚类;
dist(bi,pc)>θ1 (5)
式中dist(bi,pc)代表基站bi的坐标与重心pc的欧几里得距离,θ1代表聚类距离阈值;
根据轨迹点的定义,需要将聚类中心的坐标转换为基站所在坐标,用重心pc所在泰森多边形内的基站位置代替重心pc坐标;本过程使用长度为n1=3的滑动窗口,可移除模式为{b1,b2,b1}和{b1,b2,b3}的基站局部定位错误,其中b1,b2和b3代表距离近的三个基站;同时,大于两个的距离很近的相邻异常轨迹点,也在此过程中被一个聚类中心替代;
过程3:基于模式识别的轨迹平滑;
此过程基于模式识别以平滑轨迹以解决的手机信令数据的震荡问题;根据定义,异常轨迹点是距离远于真实轨迹的手机信令数据轨迹点,异常轨迹点簇表示存在连续多个距离很近的异常轨迹点,由于过程2已经移除含有大于2个异常轨迹点的异常轨迹点簇,因此本过程中仅需要考虑异常轨迹点或有2个异常轨迹点的异常轨迹点簇;
长度n2=3滑动窗口移除单个异常轨迹点,对于位于滑动窗口内的基站序列{bi,bi+1,bi+2},符合式(6)的基站bi被判定为轨迹点i存在异常的基站;
式中θ2表示两正确轨迹点中的最大可能距离,最大可能距离可由基站分布推断得到;
用长度n2=4滑动窗口移除有2个异常轨迹点的异常轨迹点簇,对于位于滑动窗口内的基站序列{bi,bi+1,bi+2,bi+3},符合式(7)的基站bi被判定为轨迹点i存在异常的基站;
式中θ2表示两正确轨迹点中的最大可能距离;
(2)从基站层面基于最短路的思想在稀疏的轨迹数据中进行插值,对降噪后的轨迹补全以获得连续的基站轨迹;具体为:
两个连续轨迹点的时间间隔可能过长,数据点过于稀疏,以至于不能反映客户端的真实移动轨迹,为解决上述空间不确定性问题,步骤(2)使用基站层面的路径补全方法,基于最短距离的思想,在稀疏的轨迹点中插入轨迹点以获得连续的手机轨迹;
如果所有的轨迹内的基站Basem都与其下一个基站相邻,则该基站轨迹Tram被认为是连续的,轨迹Tram中的每一个基站对(bi,bi+1)可得到以此两个轨迹点为端点的线段bibi+1;如果线段bibi+1的中点pm所在基站元胞Cellm不在现有基站轨迹内,则将中点pm所在基站bm插入基站轨迹,直到轨迹内所有的基站对(bi,bi+1)均相邻;
采用的基站层面的轨迹补全方法,具体求解方案分为以下四个步骤:
步骤0:输入原始基站轨迹与基站坐标;
步骤1:将基站对(bi,bi+1)按照其长度L(bi,bi+1)排序;
步骤2:按照排序后的顺序,对于每一个基站对(bi,bi+1),计算其对应线段中点
步骤3:如果中点pm不属于元胞Cellm,则将bm插入(bi,bi+1)之间;
步骤4:重复步骤2和步骤3直到所有的轨迹内的基站bi都与其下一个基站bi+1相邻;
上述算法中基站对的长度L(bi,bj)可用动态规划的算法提高求解效率;
步骤0:输入基站坐标;
步骤1:如果基站bi与基站bj相邻,则L(bi,bj)=2,否则转入步骤2;
步骤2:计算将基站对的长度更新为L(bi,bj)=L(bi,bm)+L(bm,bj)-1;
步骤3:遍历所有的轨迹对;
(3)基于对断面客流的定义,统计穿过断面的轨迹数量,用折减系数对估算值进行修正,得到断面客流量;具体为:
利用步骤(2)中得到的连续基站轨迹计算断面客流,在二维空间里,给定断面的起点ps和终点pe,断面表示为向量C表示被断面切割到的基站元胞组成的集合,B代表C中元胞对应的基站;
利用穿过断面的连续基站轨迹的数量计算断面客流,引入右手定则以区分断面两端的客流,根据式(8)穿过断面的基站轨迹Tram满足下列条件:(i)如果轨迹中存在基站对(bi,bi+1),该基站对所对应的线段bibi+1与断面端点对应的线段pspe相交;(ii)断面向量与轨迹对向量之间的方向满足右手螺旋定则;具体计算过程中,利用两向量间的旋转角判定两线段是否相交;在此步骤中,仅需要对仅有包含至少一个bi∈B的轨迹对需要计算;
由于在断面的端点处穿过断面的基站轨迹其真实轨迹可能并不穿过断面,因此需要对在断面的端点处穿过断面的基站轨迹进行系数折减,式(9)中折减系数定义为断面在公共边上的投影长度与公共边长度的比值;
式中和表示公共边的端点,是基站对(bi,bi+1)的折减系数,断面客流的计算值为:
式中代表断面客流的计算值,是集记后的通过断面的基站对(bi,bi+1)的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911119105.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置