[发明专利]一种使用轨迹嵌入对用户活动轨迹建模的方法在审
申请号: | 201810637194.4 | 申请日: | 2018-06-20 |
公开(公告)号: | CN109409393A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 郑恺;许佳捷;杨文彦;赵艳 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 苏州广正知识产权代理有限公司 32234 | 代理人: | 刘盼盼 |
地址: | 215000 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户活动 嵌入 建模 相似度 算法 高斯混合模型 二进制编码 轨迹序列 哈希算法 活动轨迹 活动信息 模拟用户 时间分布 时间分割 时间片段 时间特征 序列性 挖掘 降维 向量 转化 发现 | ||
1.一种使用轨迹嵌入对用户活动轨迹建模的方法,其特征在于,首先利用高斯混合模型来模拟用户的活动时间分布,并通过时间分割步骤将用户活动时间分成多个时间片段,接着提出一个轨迹嵌入算法,通过把轨迹嵌入算法作为段落来挖掘活动轨迹的序列性,最后使用一个哈希算法来达到降维的目的,将用户向量转化为对应的二进制编码并计算用户之间的相似度。
2.根据权利要求1所述的使用轨迹嵌入对用户活动轨迹建模的方法,其特征在于,所述的高斯混合模型的公式为:
给定一个活动α,表示在时间单元t时执行该活动的用户数为yt,假设满足单高斯分布,其中,K是单高斯分布的数量,ωk是第k个分布对应的权重。μk和表示第k个分布的均值和方差。
3.根据权利要求2所述的使用轨迹嵌入对用户活动轨迹建模的方法,其特征在于,所述的ωk,μk,三个参数使用EM算法来估计,通过在E步和M步之间来回迭代来实现,具体过程如下:
(1)随机初始化所有参数,一天被分割成24个单元,每个小时代表一个单元;
(2)E步中,属于第k个分布的观测值的先验概率为
(3)M步中,所有参数基于新的先验概率来跟新,跟新后的参数通过以下公式可得
(4)重复步骤(2)和(3),直至收敛。
4.根据权利要求1所述的使用轨迹嵌入对用户活动轨迹建模的方法,其特征在于,所述的轨迹嵌入算法应用段向量来概括每位用户活动的序列性,是一种从文本中学习连续分布式向量表示的无监督方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810637194.4/1.html,转载请声明来源钻瓜专利网。