[发明专利]基于知识图谱的个体出行补全方法、电子设备及存储介质有效
申请号: | 202310017021.3 | 申请日: | 2023-01-06 |
公开(公告)号: | CN115934701B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 杨宇星;张枭勇;邓普阳;胡芳侨;陈振武;杨良;刘星;郭家颖 | 申请(专利权)人: | 深圳市城市交通规划设计研究中心股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/23;G06F16/25;G06F16/29;G06F16/36;G06F16/387;G16H50/80 |
代理公司: | 哈尔滨市伟晨专利代理事务所(普通合伙) 23209 | 代理人: | 李冬爽 |
地址: | 518131 广东省深圳市龙华区民治*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 个体 出行 方法 电子设备 存储 介质 | ||
1.基于知识图谱的个体出行补全方法,其特征在于,包括以下步骤:
S1.构建流行性疾病知识图谱,包括以下步骤:
S11.通过T+1方式更新多维度个体数据,个体数据包括:人口信息、场所进入信息、流行病检测信息、地址基础信息、公交刷卡数据、轨道刷卡数据、个人社保信息和社区网格信息;
S12.基于个体数据构建的知识图谱本体:针对流行性疾病调查的图谱的实体包括:调查个体、场所、活动链、社区地址和街道地址;实体的相互关系为:调查个体每天具有一个活动链实体,活动链实体由调查个体一天内到访过的场所组成;
S2.基于知识图谱本体录入历史数据,包括以下步骤:
S21.提取个体数据,通过时空轨迹相似度匹配的方法实现交通卡实名匹配;
S22.通过活动与场所之间的关联识别个体的居住地和工作地;
S23.通过活动信息拼接形成个体一天的出行链;
S24.每天通过T+1更新的方式,更新个体数据与新增的个体一天的出行链,导出更新数据;
S25.通过数据转换的方式把新增数据转为知识图谱导入表,最后录入知识图谱;
S3.判断个体一天的出行链是否缺失到访场所或交通出行,进行数据的补齐,包括以下步骤:
S31.基于个体历史出行数据推断行程数据是否存在OD匹配异常和时间匹配异常,当个体在两个到达场所之间或两个出行之间或场所和出行之间的关系是时间上连续,空间上相距超过阈值且中间无出行信息时,判定为存在OD异常;当个体在两个出行之间或场所和出行之间或同一个出行中时间上连续,但中间无打卡记录的时间超过阈值时,判定为时间异常;
S32.基于手机信令数据验证推断行程数据异常的准确性,并对判断有误的参数进行调整,方法是,包括以下步骤:
S321.抽样个体出行数据集以及对应的手机信令点集合,假设个体整日信令序列为;
S322.从离散的信令序列抽取出驻留点与出行数据集进行对应,从信令序列提取驻留点序列作为异常判断的参考基准;
S323.对所有个体出行打卡数据以个体一天的出行链为单位进行异常判断,对比对应的驻留点序列,若异常判断的时间和范围与驻留点匹配,则异常判断条件无误,若不匹配,则异常判断错误并累计误报,直到完成所有个体的判断;
324.循环结束后计算误报累计值,若误报率高于阈值则按照误报过多调整参数,若误报率为0,则按照条件过于宽松调整参数;经过多轮的迭代达到目标误报率,输出参数作为优化结果;
S33.根据异常行程,在异常个体一天的出行链中找到场所补全的空间和时间范围;
OD匹配异常:根据出行上下站点和时间推荐可能到达的场所,以及从上一个场所到推荐场所的推测出行;
时间匹配异常:根据历史同时段可能到达场所以及出行上下站点覆盖范围的推荐可能出行场所;
S34.利用图谱低维嵌入向量和机器学习方法,挖掘个体的时空关联特征,形成个体出行规律标签,方法是:包括以下步骤:
S341.确定个体出行类型标签,以TransH算法为基础,对有标签数据进行投影向量的训练,得到投影模型;
S342.将个体出行的实体与关系基于投影向量进行低维空间映射,得到关系和实体的向量表达,从低维向量提取行规律特征并赋予标签;
S35.对个体一天的出行链C进行异常判断,得到可能缺失到访场所的时间段,对时间段可能到访的位置进行以下计算:
;
其中,为场所和行程起止点所在的位置,表示本日第i个到访场所后可能缺失的到访场所,表示本日第i+1个已知到访的场所,表示本日第i个行程的结束地点,如公交地铁下车站点,出租下车点,表示本日第i+1个行程的起始点,如公交地铁上车站点,出租车接客地点;
在图谱中通过个体出行规律标签赋予人与场所之间的关联值后基于随机游走算法PersonalRank实现基于图谱的对个体B可能到访场所的推荐,从个体B开始在个体场所二分图之间进行随机游走,以的概率从个体x的出边中,等概率选择一条游走过去,到达顶点b后,由的概率继续从顶点b的出边中,等概率选择一条继续游走到下一个节点,或者(1-)的概率回到顶点A,迭代的停止时机为所有相关场所对A的重要度收敛,公式表达为:
;
其中,PR(i)为到访顶点i的访问权重,out(i)表示顶点i的出度,在得到场所权重排序后,基于进行进一步的收敛:
;
得到个体B到访场所可能性高到低的排序,取可能性最高的场所作为推荐结果并补全出行链,或以可能性最高的前n个场所作为个体可能到访的场所,进行流调。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市城市交通规划设计研究中心股份有限公司,未经深圳市城市交通规划设计研究中心股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310017021.3/1.html,转载请声明来源钻瓜专利网。