[发明专利]用户档案数据处理方法、装置、设备及存储介质有效
申请号: | 202011211687.5 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112328658B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 崔轩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘丹;臧建明 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 档案 数据处理 方法 装置 设备 存储 介质 | ||
1.一种用户档案数据处理方法,包括:
获取来自不同数据源的多个原始数据集,其中每一所述原始数据集中包括多个用户的不同属性信息;
根据各所述原始数据集中已知的各用户的属性信息关联关系,从多个所述原始数据集中筛选出相同用户的多个不同第一属性信息;
根据预设共现条件,从多个所述原始数据集中筛选出相同用户的多个不同第二属性信息;
将各相同用户的第一属性信息和第二属性信息进行关联,根据相互关联的第一属性信息和第二属性信息获得最终用户档案信息集合,并存储或输出;
所述从多个所述原始数据集中,根据预设共现条件筛选出相同用户的多个不同第二属性信息,包括:
从所述多个原始数据集中获取满足预设共现条件的属性信息,并确定满足预设共现条件的属性信息存在关联关系,其中所确定的关联关系以目标形式进行存储;
从所确定的关联关系中获取具有交集的关联关系;
将具有交集的关联关系对应的属性信息确定为相同用户的第二属性信息;
所述从所述多个原始数据集中获取满足预设共现条件的属性信息,并确定满足预设共现条件的属性信息存在关联关系,包括:
获取所述多个原始数据集中每一用户的属性信息的采集时间和采集位置;
筛选出采集时间小于预设时间间隔、且采集位置小于预设距离的属性信息,确定为共现的属性信息;
获取所述共现的属性信息的共现次数,若共现次数超过预设次数,则确定所述共现的属性信息存在关联关系。
2.根据权利要求1所述的方法,其中,所述根据各所述原始数据集中已知的各用户的属性信息关联关系,从多个所述原始数据集中筛选出相同用户的多个不同第一属性信息,包括:
获取每一所述原始数据集中已知的各用户的属性信息关联关系,其中所述属性信息关联关系以目标形式进行存储;
从各所述属性信息关联关系中获取具有交集的属性信息关联关系;
将具有交集的属性信息关联关系对应的属性信息确定为相同用户的多个不同第一属性信息。
3.根据权利要求2所述的方法,其中,所述根据所述属性信息关联关系从多个所述原始数据集中筛选出相同用户的多个不同第一属性信息之后,还包括:
对多个不同第一属性信息进行聚合,以获得采用目标形式进行存储的第一属性信息集合;
所述根据预设共现条件筛选出相同用户的多个不同第二属性信息之后,还包括:
对多个不同第二属性信息进行聚合,以获得采用目标形式进行存储的第二属性信息集合。
4.根据权利要求3所述的方法,其中,所述目标形式为连通图形式;
所述对多个不同第一属性信息进行聚合,以获得采用目标形式进行存储的第一属性信息集合,包括:
根据相同用户的第一属性信息,构建第一连通图,作为所述第一属性信息集合,其中相同用户的每一第一属性信息作为所述第一连通图的一个顶点;
所述对多个不同第二属性信息进行聚合,以获得采用目标形式进行存储的第二属性信息集合,包括:
根据相同用户的第二属性信息,构建第二连通图,作为所述第二属性信息集合,其中相同用户的每一第二属性信息作为所述第一连通图的一个顶点。
5.根据权利要求4所述的方法,其中,所述将各相同用户的第一属性信息和第二属性信息进行关联,根据相互关联的第一属性信息和第二属性信息获得最终用户档案信息集合,包括:
将相同用户的所述第一属性信息集合和所述第二属性信息集合中对应的属性信息进行关联及归并,得到综合属性信息集合;
从所述多个原始数据集中,分别获取所述综合属性信息集合中每一属性信息对应用户的其他相关信息;
将相同用户的所述综合属性信息集合与所述其他相关信息进行关联存储,得到所述最终用户档案信息集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011211687.5/1.html,转载请声明来源钻瓜专利网。