[发明专利]基于时空模式的用户行为相似性挖掘方法有效

专利信息
申请号: 201410159039.8 申请日: 2014-04-18
公开(公告)号: CN103942310B 公开(公告)日: 2018-12-21
发明(设计)人: 涂岩恺;黄家乾;时宜;陈典全 申请(专利权)人: 厦门雅迅网络股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 厦门市精诚新创知识产权代理有限公司 35218 代理人: 巫丽青
地址: 361000 福建*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及用户行为轨迹挖掘技术领域,具体涉及一种基于时空模式的用户行为相似性挖掘方法。本发明针对LBSN用户的签到记录不连续、碎片化严重的状况,发明了签到点集的时空模式匹配方法进行数据的用户行为挖掘,将签到点分为秩次子集与孤立点两类,对秩次子集内的时间顺序信息给予保留,并在相似性比较时与位置信息进行有效融合。发明了一种新的时空Hausdorff距离匹配方法进行有效的时空模式相似判别,无需进行签到点间的行为轨迹恢复,同时有效的利用了签到时间顺序信息,因而能比较好的判断用户签到行为的相似性。
搜索关键词: 基于 时空 模式 用户 行为 相似性 挖掘 方法
【主权项】:
1.一种基于时空模式的用户行为相似性挖掘方法,其特征在于:包括以下步骤:步骤1:时空数据融合步骤,获取单个用户的所有签到数据,所述签到数据包括签到时间、签到点位置信息,将该签到点按签到时间先后顺序排列,并将该签到点分成孤立点与秩次子集两类,孤立点只保留位置信息,秩次子集中包含若干签到点,并将签到时间转换为秩次信息,秩次子集中保留签到点位置和秩次信息;步骤2:时空模式匹配步骤:利用时空Hausdorff距离匹配方法,基于秩次信息与签到点位置信息计算出的用户行为相似性,比较孤立点与孤立点之间的相似性距离,秩次子集合与秩次子集合之间的相似性距离,以及孤立点与秩次子集合之间的相似性距离,再根据该相似性距离,得到融合空间与时间两种信息的用户签到行为相似性度量值;所述步骤1还包括以下步骤:步骤11:将每个用户的所有原始签到点的签到数据依据时间顺序排列为{P1,P2,P3,...,PM},每个签到点的签到数据为Pi={x,y,t}(i=1,2,...,M),其中(x,y)表示签到点Pi的经纬度位置信息,t表示签到点Pi的签到时间,步骤12:构成秩次子集,获取每个用户一天的签到点Pi构成单独的子集合Qj={Pj,Pj+1,Pj+2,...,Pj+N}(N≤M),并对该单独的子集合Qj内的签到点赋予秩次权值,即Qj内按时间顺序第一个签到点秩次为rank=1,第二个签到点秩次为rank=2,以此类推,获得秩次后用秩次rank信息替换时间信息t,得到新的秩次子集合Q’j={P’j,P’j+1,...P’j+N},P’j={x,y,rank},步骤13:构成孤立点集合,所述孤立点的划分方法为:一用户1天以内(从当天0:00:00到23:59:59)只有一个签到点,则该签到点划分为孤立点Pi,由于该孤立点Pi不构成成秩次子集,则去除时间信息,只保留位置信息,形成孤立签到点Pi=(x,y)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门雅迅网络股份有限公司,未经厦门雅迅网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410159039.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top