[发明专利]一种多源异构在线服务平台用户数据关联融合方法及系统在审
申请号: | 202310222537.1 | 申请日: | 2023-03-09 |
公开(公告)号: | CN116304981A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 陆剑江;王璞;陈伟;赵雷 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F18/25 | 分类号: | G06F18/25;G06F18/22;G06Q50/00;G06Q50/10;G06N3/048;G06N3/08 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 王广浩 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多源异构 在线 服务 平台 用户 数据 关联 融合 方法 系统 | ||
本发明提供一种多源异构在线服务平台用户数据关联融合方法及系统,方法包括采集不同在线服务平台的用户数据和城市路网数据;构建包括用户的行程轨迹数据、位置签到数据、社交网络数据的异构数据融合框架;计算用户的时空访问概率索引以及社交网络结构隐空间低维向量,得到用户的候选匹配用户串和候选匹配用户串集合;计算用户的时空域、社交网络结构域的相似度得到对应的匹配分数,整合匹配分数得到最终的相似度计算结果;根据最终的相似度计算结果和设定的匹配阈值,得到实际的用户关联集合,将多个在线服务平台数据集中同一个用户的所有数据进行整合。本发明实现了多源异构在线服务平台用户数据的高效率和高质量的关联融合。
技术领域
本发明涉及数据信息处理技术领域,尤其涉及一种多源异构在线服务平台用户数据关联融合方法及系统。
背景技术
随着传感器、物联网和位置社交网络等技术的持续进步和成熟应用,提供综合用户服务的在线业务服务平台也得到了迅速的发展,例如滴滴打车、高德打车、Uber、新浪微博、豆瓣、抖音、Instagram和Facebook等。这些在线业务服务平台产生和存储了各类丰富的用户数据,如基于城市道路路网上的行程轨迹,网络(图)结构的社交关系,以及用户发布的打卡位置签到、文字文本、图片和视频等信息。这些数据信息对于挖掘用户的内在联系、分析用户的行为模式、完善用户的个人画像和为用户提供更好的服务起着重要的作用。
然而,虽然利用单个在线服务平台的数据就可以进行用户相关的分析研究工作,但单一在线服务平台的数据源收集会存在着数据稀疏、数据缺失和数据巧合等缺点,从而导致最终的研究结果由于数据质量问题不尽如人意。因此,在复杂的大数据应用场景里,往往需要连接和融合多个不同在线服务平台的异构数据源,获得更加完整和准确的多源异构同一数据表示,从而更好的支撑后续的研究工作。
数据融合也叫信息融合,是对多源、异构和不完整的数据集进行分析整合,然后得出准确和统一的信息表示。按照融合的层次不同,可以分为数据级融合、模型级融合和决策级融合,一般不同的在线服务平台数据都有着不同的物理结构和逻辑结构,为了平衡计算量和准确度,绝大部分研究选择模型级的融合方案,即通过数据的实际产生者(用户)进行关联融合,目的是识别多个异构在线服务平台数据中相同的用户实体,并以此为基础进行数据关联。
目前许多学者对基于用户关联的数据融合问题进行了相关的研究,在待融合的在线服务平台数目方面,从两个服务平台的用户关联融合,逐渐扩展至三个乃至更多的平台上,而在研究的融合算法方面,又包括了基于用户属性的方法、基于用户生成内容的方法、基于网络结构的方法和混合方法等。两个在线服务平台的用户关联融合是基础的数据融合工作,一般需要两两匹配不同平台之间的所有用户,从而完成跨平台的用户相似度计算和对应数据的关联。在多个平台的用户关联问题中,平台之间的用户相似度匹配计算量将呈指数级增长,而且多平台之间采用的不同匹配顺序也可能会对结果产生影响。
虽然已经有部分工作开始致力于多个异构在线服务平台的用户数据融合算法研究,但是它们并没有在城市真实路网环境下考虑异构数据的多样性问题。此外,目前一些基于社交网络的用户关联模型,直接利用用户关系网络的度数、聚类系数或共同邻居数量等特征计算用户的相似度。然而,这些特征对网络结构十分敏感,结构的轻微变化或噪声影响就可能产生不同的匹配结果。由于上述问题的存在,导致现有的用户数据融合方法的融合效率低、融合效果不佳。
发明内容
为此,本发明实施例提供了一种多源异构在线服务平台用户数据关联融合方法及系统,用于解决现有技术中用户数据融合方法的融合效率低、融合效果不佳的问题。
为了解决上述问题,本发明实施例提供一种多源异构在线服务平台用户数据关联融合方法,该方法包括:
S1:采集不同在线服务平台的用户数据和城市路网数据;
S2:基于城市路网数据,构建包括用户的行程轨迹数据、位置签到数据、社交网络数据的异构数据融合框架;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310222537.1/2.html,转载请声明来源钻瓜专利网。