[发明专利]一种用户轨迹信息挖掘方法在审
申请号: | 202110174281.2 | 申请日: | 2021-02-09 |
公开(公告)号: | CN112966010A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 杨晓逵;吴晓晓 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06F16/2458;G06N3/04;G01S19/42 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 耿慧敏;朱伟军 |
地址: | 518060 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 轨迹 信息 挖掘 方法 | ||
本发明公开了一种用户轨迹信息挖掘方法。该方法包括:构建包含多个超级节点的轨迹序列,其中所述轨迹序列反映用户不同时间的行动轨迹,每个超级节点表征用户签到的位置、位置属性和用户属性;将所述轨迹序列输入到预训练模型,获得映射后的固定维度的向量化表示,作为用户画像序列;将所述用户画像序列输入分类器或聚类器进行分析,获得用户分类或聚类结果。本发明能够对用户多维度的信息进行全方位挖掘,并将用户轨迹信息映射到固定的低维空间,从而节省了空间开销并同时减少了信息丢失带来的影响。
技术领域
本发明涉及信息分析技术领域,更具体地,涉及一种用户轨迹信息挖掘方法。
背景技术
在疫情控制历史上,控制传染源和切断传播途径是主要方式,而这两者都依赖于流行病调查(或简称流调)。在流行病调查中,调查员将会对感染者进行采访,询问他最近的生活轨迹,如去过哪里、见过谁等。但这种方式通常很难有效展开,有时候因为隔离或者治疗原因无法及时采访感染者,有时受访者不记得准确的信息。同时,一对一的问卷调查会消耗大量的资源和人力,这促使对传统的流行病调查方法进行改进。
现有的网络用户轨迹信息的挖掘方法通常有以下两种:
(1)线性简化压缩方法。将GPS设备收集到的少量数据所代表的用户近似轨迹来替代用户的真实轨迹,实现对用户轨迹的压缩,该算法主要的思想是对采集到的轨迹点进行均匀采样,每隔K个采样点保留一个,如图1所示,用户的轨迹向量被近似为(p1,p4,p6)。
(2)基于路网结构的压缩方法。通过在原始的轨迹数据中加入路网结构,使得用户的轨迹落在相应的路段上。这种方法更具有现实意义,路网络结构的稳定性和有效性使得可以通过路网结构进行用户轨迹的表示,如图2所示,最终的轨迹为(p1,p3,p6)。
然而,现有技术对用户轨迹向量进行挖掘时,用户轨迹向量的空间开销无法确定,可能造成较大的空间开销;在提取用户轨迹向量的过程中,仅仅只能记录运动轨迹信息,且对轨迹点的压缩可能导致重要信息的丢失;无法处理地点属性信息和用户行为信息等。
发明内容
本发明的目的是克服上述现有技术的缺陷,提供一种用户轨迹信息挖掘方法,通过分析用户的历史轨迹,能够及时、准确地获得用户分类。
本发明的技术方案是,提供一种用户轨迹信息挖掘方法。该方法包括:构建包含多个超级节点的轨迹序列,其中所述轨迹序列反映用户不同时间的行动轨迹,每个超级节点表征用户签到的位置、位置属性和用户属性;将所述轨迹序列输入到预训练模型,获得映射后的固定维度的向量化表示,作为用户画像序列;将所述用户画像序列输入分类器或聚类器进行分析,获得用户分类结果。
与现有技术相比,本发明的优点在于,所提出的用户轨迹信息挖掘方法,可以将用户向量映射到低维空间,且用户轨迹向量的维度大小是确定的;在提取用户轨迹向量时,同时考虑了用户的位置属性和行为属性等,能够对用户多维度的信息进行全方位挖掘,从而减少了信息丢失带来的影响。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1是现有技术的线性简化压缩方法示意图;
图2是现有技术的基于路网结构的压缩方法示意图;
图3是根据本发明一个实施例的用户轨迹信息挖掘方法的流程图;
图4是根据本发明一个实施例的轨迹按时间顺序排列的地点示意图;
图5是根据本发明一个实施例的用户活动轨迹示意图;
图6是根据本发明一个实施例的基于Doc2Vec的预训练模型框架图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110174281.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置