[发明专利]一种多源异构在线服务平台用户数据关联融合方法及系统在审
申请号: | 202310222537.1 | 申请日: | 2023-03-09 |
公开(公告)号: | CN116304981A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 陆剑江;王璞;陈伟;赵雷 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F18/25 | 分类号: | G06F18/25;G06F18/22;G06Q50/00;G06Q50/10;G06N3/048;G06N3/08 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 王广浩 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多源异构 在线 服务 平台 用户 数据 关联 融合 方法 系统 | ||
1.一种多源异构在线服务平台用户数据关联融合方法,其特征在于,包括:
S1:采集不同在线服务平台的用户数据和城市路网数据;
S2:基于城市路网数据,构建包括用户的行程轨迹数据、位置签到数据、社交网络数据的异构数据融合框架;
S3:根据异构数据融合框架,计算用户的时空访问概率索引以及社交网络结构隐空间低维向量,得到用户的候选匹配用户串和候选匹配用户串集合;
S4:根据用户的候选匹配用户串和候选匹配用户串集合,计算用户的时空域、社交网络结构域的相似度得到对应的匹配分数,整合匹配分数得到最终的相似度计算结果;
S5:根据最终的相似度计算结果和设定的匹配阈值,得到实际的用户关联集合,将多个在线服务平台数据集中同一个用户的所有数据进行整合。
2.根据权利要求1所述的多源异构在线服务平台用户数据关联融合方法,其特征在于,在步骤S2中,基于城市路网数据,构建包括用户的行程轨迹数据、位置签到数据、社交网络数据的异构数据融合框架的方法具体包括:
行程轨迹数据:令时间阈值为εt,距离阈值为εd,如果在轨迹τ中存在一组唯一且连续的位置点和时间戳Λ={(pi,ti),(pi+1,ti+1),…,(pj,tj)},使得对于任意的k都满足ds(pi,pk)≤εd,且对应的|tj-tk|≥εt,ik≤j,那么该区域就是停驻区域;令停驻区域的位置和时间戳集合为Θ={(pi,ti),(pi+1,ti+1),…,(pj,tj)},那么轨迹的停驻点sr表示为:
其中,τ={(p1,t1),(p2,t2),…(pi,ti),…,(pm,tm)},表示时空行程轨迹,pi=(lng,lat)表示城市路网位置点pi的经度和纬度,ti为对应的时间戳,ds(pi,pk)为pi与pk之间的路网空间距离,sr(t)为停驻点sr所处的时间戳;
位置签到数据:ω=(p,t),其中,ω为用户的位置签到数据,p=(lng,lat)表示签到位置p的经度和纬度,t为对应的时间戳;
社交网络数据:在社交网络Gs=(Vs,Ms)中,其中Vs为用户集合,Ms为用户之间关注关系的邻接矩阵;用邻接矩阵Ms表示一阶亲密度矩阵,用表示二阶亲密度矩阵,其中一阶亲密度表示两个用户的直接关系程度,二阶亲密度表示用户的间接相似程度。
3.根据权利要求1所述的多源异构在线服务平台用户数据关联融合方法,其特征在于,步骤S3中,根据异构数据融合框架,计算用户的时空访问概率索引以及社交网络结构隐空间低维向量,得到用户的候选匹配用户串和候选匹配用户串集合的方法具体包括:
S31:根据异构数据融合框架,采用基于时间段划分的时间索引计算用户的时间区域活动概率,得到用户的时间区域访问概率索引;采用基于空间区域划分的空间索引计算用户的空间区域活动概率,得到用户的空间区域访问概率索引;基于用户节点的一阶亲密度矩阵和二阶亲密度矩阵计算用户的社交网络结构隐空间低维向量;
S32:基于时空域访问概率索引以及社交网络结构隐空间低维向量,对用户相似度匹配空间进行剪枝得到用户的候选匹配用户串和候选匹配用户串集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310222537.1/1.html,转载请声明来源钻瓜专利网。