[发明专利]一种基于无监督学习的用户行程挖掘方法和装置有效

申请号：	201710096379.4	申请日：	2017-02-22
公开（公告）号：	CN108460057B	公开（公告）日：	2023-09-29
发明（设计）人：	朱杰;王志强;孙家棣	申请（专利权）人：	深圳市赛格车圣科技有限公司
主分类号：	G06F16/28	分类号：	G06F16/28;G06F16/35;G06F18/23213
代理公司：	深圳砾智知识产权代理事务所(普通合伙) 44722	代理人：	翁治林
地址：	518000 广东省深圳市南山区***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于监督学习用户行程挖掘方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种基于无监督学习的用户行程挖掘方法，包括以下步骤：步骤S1、对车载终端上传到数据平台的原始样本集进行处理，选定用于建立用于模型学习的训练样本的特征，组成样本库；以及步骤S2、对样本库使用k均值算法进行聚类分析，得到行程起点和非行程起点集合，从而区分出每一个行程。在本发明中对于用户上传到数据平台的数据，由于其中不包含行程识别码，因此我们采用未知分类标签的无监督学习方式，进行聚类分析，从而得到行程起点集合和非行程起点集合，以区分出车辆行驶的每一个行程，为了能够进一步的分析用户的驾驶行为奠定基础。

技术领域

本发明涉及汽车领域，尤其涉及一种基于无监督学习的用户行程挖掘方法和装置。

背景技术

随着城市化的不断深入和推进，城市越来越拥挤，越来越多的家庭拥有了自己的车。在这种情况下，司机的驾驶水平对城市交通的畅通程度起到了重要影响作用。因此，如果能够根据用户通过车联网上传到数据平台的海量数据进行分析和挖掘，区分出车辆行驶的每一个行程，对于进一步分析用户的驾驶行为将会有很大帮助。

发明内容

本发明的目的在于提供一种基于无监督学习的用户行程挖掘方法和装置以根据用户上传的数据进行聚类分析，从而区分出每一个行程。

一方面，本发明实施例提供一种基于无监督学习的用户行程挖掘方法，包括以下步骤：步骤S1、对车载终端上传到数据平台的原始样本集进行处理，选定用于建立用于模型学习的训练样本的特征，组成样本库；以及步骤S2、对所述样本库使用k均值算法进行聚类分析，得到行程起点和非行程起点集合，从而区分出每一个行程

优选地，所述步骤S1包括：

步骤S11、对车载终端上传到数据平台的所述原始样本集进行处理，计算相邻两个元组的特征变化量；

步骤S12、分析所述原始样本集中的多个特征，对比行程起点集和非起点集在所述多个特征上的差异，选定用于建立用于模型学习的训练样本的特征，组成样本库。

优选地，在所述步骤S12中选定的用于建立用于模型学习的训练样本的特征为GPS时间变化量、速度大小和状态信息变化量。

优选地，所述步骤S2包括：