[发明专利]一种基于深度学习的轨迹序列聚类方法在审
申请号: | 202111298174.7 | 申请日: | 2021-11-01 |
公开(公告)号: | CN113988203A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 王超;汪愿愿;罗实;王永恒;傅四维;董子铭 | 申请(专利权)人: | 之江实验室;浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 孙孟辉 |
地址: | 311100 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 轨迹 序列 方法 | ||
1.一种基于深度学习的轨迹序列聚类方法,其特征在于,包括如下步骤:
步骤1,预训练层:使用序列到序列的自编码器模型,学习轨迹数据的低维特征表示;
步骤2,初始聚类层:对预训练层获得的轨迹特征表示执行多次K-Means聚类算法,并选择最优聚类结果中的聚类中心作为初始的簇中心;
步骤3,联合训练优化层:联合轨迹聚类和深度特征提取方法,提出结合序列到序列自编码器模型重构误差和聚类误差的优化损失函数,将轨迹特征表示映射到更加适合聚类的特征空间,并端到端获得聚类结果。
2.如权利要求1所述的一种基于深度学习的轨迹序列聚类方法,其特征在于,所述步骤1,具体包括以下步骤:
步骤1.1,首先,将轨迹数据点映射到各个大小相等的空间格网,并把每个网格视为离散标记;
步骤1.2,接着,使用序列到序列的自编码器模型,将轨迹序列嵌入到可以反映其潜在路径信息的特征空间中,提取代表轨迹数据真实路径的低维向量。
3.如权利要求2所述的一种基于深度学习的轨迹序列聚类方法,其特征在于,所述步骤1.1具体为:将研究区域划分为大小相等的空间网格并把每个网格视为离散的标记,落入相同网格的轨迹点可以用同一标记来表示,这些网格视为自然语言处理中的token,每个网格都有唯一的标识,所有网格的集合组成了词汇表V。
4.如权利要求2所述的一种基于深度学习的轨迹序列聚类方法,其特征在于,所述步骤1.2具体为:预训练层使用序列到序列的自编码器模型学习轨迹数据的低维特征表示,该模型的训练等效于最小化重构轨迹特征分布Py和原始轨迹分布Pr之间的KL散度,即KL(Pr||Py),对于给定的轨迹,训练的目标函数如下:
其中,是在轨迹输入模型后重构的轨迹特征yt的分布,是原始轨迹rt的空间邻近分布,用于yt的解码过程,‖·‖2代表网格质心坐标之间的欧几里得距离,θ是控制原始轨迹r分布的距离比例参数;
因此对于一个给定的数据集,总的重构损失是数据集中所有轨迹对象在公式(2)中误差的累加和,记为其中N是数据集的大小。
5.如权利要求4所述的一种基于深度学习的轨迹序列聚类方法,其特征在于,所述步骤2具体为:
所述K-Means聚类算法的损失函数表示为:
式中,zi是通过预训练阶段学习到的轨迹特征,μk是簇中心,sik是一个布尔型变量,如果μk是离zi最近的簇中心,则sik为1,否则sik为0;选择softmax函数对公式(3)进行连续化表示,对于给定的特征zi,聚类损失函数采用以下形式表示,所有参数都是可导的:
其中,‖·‖2代表欧几里得距离,σ决定聚类是硬分配还是软分配,具体地,当σ为0时,zi到所有簇中心的权重都相等,属于软分配聚类,当σ为+∞时,相当于在嵌入空间中执行K-Means算法,属于硬分配聚类,考虑到簇中心之间应保持一定距离,提出了簇中心距离损失函数,定义为:
式中,μi和μj代表不同的簇中心,通常计算归一化后的值;
因此,数据集中所有轨迹数据的最终聚类损失函数为:
是由参数γ权衡的公式(4)和(5)的误差和,N是数据集中轨迹的总数。
6.如权利要求1所述的一种基于深度学习的轨迹序列聚类方法,其特征在于,所述步骤3的联合训练优化的目标函数为:
L=αLr+βLc (7)
式中,Lr是序列到序列的自编码器模型输出的重构轨迹特征与原始轨迹数据的误差,Lc是嵌入空间中的K-Means聚类损失,α和β是权衡重构误差和聚类误差的比例因子,决定学习到的轨迹特征表示更加逼近于原始轨迹数据还是更适合聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室;浙江大学,未经之江实验室;浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111298174.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大尺寸MEMS微镜结构及制作方法
- 下一篇:一种调理血糖平衡的功能性饼干