首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]数据处理方法以及装置有效

申请号：	202010408131.9	申请日：	2020-05-14
公开（公告）号：	CN111475492B	公开（公告）日：	2023-06-16
发明（设计）人：	孙波	申请（专利权）人：	支付宝（中国）网络技术有限公司
主分类号：	G06F16/21	分类号：	G06F16/21;G06F16/215;G06F16/22
代理公司：	北京智信禾专利代理有限公司 11637	代理人：	赵杰
地址：	201208 上海***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据处理方法以及装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种数据处理方法，包括：

获取第一数据表的关键字段集合的第一布隆索引，所述第一数据表为键值对数据结构；

利用所述第一布隆索引对第二数据表进行过滤以筛除不在所述第一布隆索引范围内的数据，得到过滤后的第二数据表，所述第二数据表为键值对数据结构；

将所述第一数据表以及过滤后的所述第二数据表中，相同关键字段的值进行关联；

所述将所述第一数据表以及过滤后的所述第二数据表中，相同关键字段的值进行关联包括：

针对第一数据表，将所述第一数据表中相同关键字段的值进行关联，获得所述第一数据表的第一关联集合；

针对所述第二数据表，将所述第二数据表中相同关键字段的值进行关联，获得所述第二数据表的第二关联集合；

将所述第一关联集合与所述第二关联集合中，相同关键字段的值进行关联；

所述将所述第一关联集合与所述第二关联集合中，相同关键字段的值进行关联包括：

根据所述第一关联集合的关键字段集合生成第二布隆索引；

利用所述第二布隆索引对所述第二关联集合进行过滤以筛除不在所述第二布隆索引范围内的数据，得到过滤后的第二关联集合；

将所述第一关联集合与过滤后的第二关联集合中，相同关键字段的值进行关联。

2.根据权利要求1所述的方法，所述方法应用于分布式系统的执行节点；所述获取第一数据表的关键字段集合的第一布隆索引包括：

所述执行节点响应于从驱动节点接收到包含所述第一布隆索引的广播，获取所述第一布隆索引，所述第一布隆索引是由所述驱动节点根据所述第一数据表的关键字段集合生成的。

3.根据权利要求1所述的方法，所述方法应用于spark分布式系统中的cogroup过程。

4.根据权利要求1所述的方法，所述第一数据表为用户数据表，所述第二数据表为用户历史交易数据表，所述关键字段为用户ID。

5.一种数据处理装置，包括：

索引获取模块，被配置为获取第一数据表的关键字段集合的第一布隆索引，所述第一数据表为键值对数据结构；

第一过滤模块，被配置为利用所述第一布隆索引对第二数据表进行过滤以筛除不在所述第一布隆索引范围内的数据，得到过滤后的第二数据表，所述第二数据表为键值对数据结构；

关联模块，被配置为将所述第一数据表以及过滤后的所述第二数据表中，相同关键字段的值进行关联；

所述关联模块包括：

第一关联子模块，被配置为针对第一数据表，将所述第一数据表中相同关键字段的值进行关联，获得所述第一数据表的第一关联集合；

第二关联子模块，被配置为针对所述第二数据表，将所述第二数据表中相同关键字段的值进行关联，获得所述第二数据表的第二关联集合；

第三关联子模块，被配置为将所述第一关联集合与所述第二关联集合中，相同关键字段的值进行关联；

所述第三关联子模块包括：

索引生成子模块，被配置为根据所述第一关联集合的关键字段集合生成第二布隆索引；

过滤子模块，被配置为利用所述第二布隆索引对所述第二关联集合进行过滤以筛除不在所述第二布隆索引范围内的数据，得到过滤后的第二关联集合；

滤后关联子模块，被配置为将所述第一关联集合与过滤后的第二关联集合中，相同关键字段的值进行关联。

6.根据权利要求5所述的装置，所述装置配置于分布式系统的执行节点；所述索引获取模块，被配置为响应于从驱动节点接收到包含所述第一布隆索引的广播，获取所述第一布隆索引，所述第一布隆索引是由所述驱动节点根据所述第一数据表的关键字段集合生成的。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于支付宝（中国）网络技术有限公司，未经支付宝（中国）网络技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010408131.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种耐用型五轴精密小龙门数控加工中心
下一篇：确定非竞争随机接入资源的方法、网络设备和终端设备

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top