[发明专利]一种基于多数据源的数据处理方法和装置在审

专利信息
申请号: 201810122574.4 申请日: 2018-02-07
公开(公告)号: CN108415965A 公开(公告)日: 2018-08-17
发明(设计)人: 龙凯;赵相龙;刘屹州;高瑞鑫 申请(专利权)人: 五维引力(上海)数据服务有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海市金茂律师事务所 31299 代理人: 王峥;谢瑞强
地址: 201203 上海市浦东新区中国*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 第一数据 地理位置数据 标识数据 方法和装置 多数据源 空间筛选 筛选条件 时间数据 数据处理 组数据 预设 筛选 数据源 构建 地理
【说明书】:

发明提供一种基于多数据源的数据处理方法和装置,方法包括:从第一数据源获取第一数据列表并且从第二数据源获取第二数据列表;其中,第一数据列表的每组数据包括:第一标识数据以及与第一标识数据相对应的第一地理位置数据和第一时间数据;第二数据列表的每组数据包括:第二标识数据以及与第二标识数据相对应的第二地理位置数据和第二时间数据;根据空间筛选条件和时间筛选条件对第一数据列表和第二数据列表进行筛选处理;其中,空间筛选条件为:第一地理位置数据和第二地理位置数据在预设地理范围之内;时间筛选条件为:第一时间数据和第二时间数据在第一预设时间范围之内;根据筛选处理后的第一数据列表和第二数据列表,构建第三数据列表。

技术领域

本发明涉及计算机技术领域,尤其涉及一种基于多数据源的数据处理方法和装置。

背景技术

大数据(big data,mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。基于大数据进行分析处理,可以提供用户画像服务,以分析用户属性和需求等。

然而现有技术中,围绕一个信息主体(如同一台设备、同一个用户、同一家企业)所产生的或与之相关的数据都分散在很多不同的数据源中,不同数据源之间毫无关联,形成若干数据孤岛。基于单个数据源进行分析处理,只能得到碎片化的画像,难以为信息主体提供完整的信息视图。

发明内容

本发明目的在于提供一种基于多数据源的数据处理方法和装置,以解决在相互没有业务逻辑的多个数据源之间进行数据关联的问题。

本发明提供的基于多数据源的数据处理方法,包括:

从第一数据源获取第一数据列表并且从第二数据源获取第二数据列表;其中,第一数据列表的每组数据包括:第一标识数据以及与所述第一标识数据相对应的第一地理位置数据和第一时间数据;第二数据列表的每组数据包括:第二标识数据以及与所述第二标识数据相对应的第二地理位置数据和第二时间数据;

根据空间筛选条件和时间筛选条件对所述第一数据列表和所述第二数据列表进行筛选处理;其中,所述空间筛选条件为:所述第一地理位置数据和所述第二地理位置数据在预设地理范围之内;所述时间筛选条件为:所述第一时间数据和所述第二时间数据在第一预设时间范围之内;

根据筛选处理后的所述第一数据列表和所述第二数据列表,构建第三数据列表。

进一步,本发明所述的数据处理方法,还包括:

根据所述第三数据列表构建第四数据列表;其中,所述第四数据列表包含所述第三数据列表下的所述第一标识数据与所述第二标识数据的全部组合关系;

计算每组所述第一标识数据与所述第二标识数据的组合的迭代次数;

根据迭代筛选条件对所述第一标识数据与所述第二标识数据的组合进行筛选处理;其中,所述迭代筛选条件为:所述迭代次数超过预设次数阈值;

根据筛选处理后的所述第一标识数据与所述第二标识数据的组合,构建第五数据列表;其中,所述第五数据列表包括:相互具有对应关系的所述第一标识数据和所述第二标识数据。

进一步,本发明所述的数据处理方法,根据所述第三数据列表构建第四数据列表的步骤具体包括:

根据n个所述预设地理范围构建n个所述第三数据列表,并且,在每个所述第三数据列表中将所述第一标识数据与所述第二标识数据进行配对组合,以构建n个所述第四数据列表;

或者,根据m个所述第一预设时间范围构建m个所述第三数据列表,并且,在每个所述第三数据列表中将所述第一标识数据与所述第二标识数据进行配对组合,以构建m个所述第四数据列表;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五维引力(上海)数据服务有限公司,未经五维引力(上海)数据服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810122574.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top