[发明专利]多重用户身份融合方法、装置、设备及存储介质有效
申请号: | 201910831646.7 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110543586B | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 张阳;杨双全;刘畅 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/9032 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多重 用户 身份 融合 方法 装置 设备 存储 介质 | ||
本申请公开了一种多重用户身份融合方法、装置、设备及存储介质,涉及大数据技术领域。具体实现方案为:获取用户身份数据,该用户身份数据具有至少两个身份特征;根据用户身份数据具有的至少两个身份特征,构建图谱网络,该图谱网络包括:表征身份特征的节点和表征身份特征的关联关系的连接边;根据该图谱网络中节点之间的连接关系、节点和连接边之间的连接关系,确定同一用户的身份群组,该身份群组包括:多个身份特征。该技术方案通过图谱网络的形式将用户身份数据具有的身份特征关联起来,不仅能够准确的确定出同一用户的多个身份特征对应的身份群组,而且其可以应用于任何场景,避免了使用范围受限的问题。
技术领域
本申请涉及计算机技术领域,尤其涉及一种大数据技术中的多重用户身份融合方法、装置、设备及存储介质。
背景技术
在互联网普及的大环境下,将虚拟用户身份(例如,设备ID,网络ID等)和真实用户身份(例如,身份证号、手机号等身份信息、车产、房产等用户资产信息)相关联,可以从不同的表现载体中还原人的完整行为,从而创造巨大的产品商业价值。
现有技术中,多重身份融合的方案主要可以基于预设的规则,将满足同一规则的多个不同用户身份确定为属于同一用户,并将该用户的多个用户身份进行融合,使其相互关联。
然而,虽然这种融合方法归属判断的准确率高,但是由于使用的规则是人为设定的,无法应用于复杂的场景,使用范围受限。
发明内容
本申请实施例提供一种多重用户身份融合方法、装置、设备及存储介质,用于解决现有融合方法无法应用于复杂的场景,使用范围受限的问题。
第一方面,本申请提供一种多重用户身份融合的方法,包括:
获取用户身份数据,所述用户身份数据具有至少两个身份特征;
根据所述用户身份数据具有的至少两个身份特征,构建图谱网络,所述图谱网络包括:表征身份特征的节点和表征身份特征的关联关系的连接边;
根据所述图谱网络中节点之间的连接关系、节点和连接边之间的连接关系,确定同一用户的身份群组,所述身份群组包括:多个身份特征。
在本实施例中,通过图谱网络的形式将用户身份数据具有的身份特征关联起来,不仅能够准确的确定出同一用户的多个身份特征对应的身份群组,而且其可以应用于任何场景,避免了使用范围受限的问题。
在第一方面的一种可能设计中,所述获取用户身份数据,包括:
获取预设的配置信息,所述配置信息包括:数据源类型、数据源路径、提取方式和提取周期;
根据所述数据源路径、所述提取方式和所述提取周期,从所述数据源类型对应数据源中提取所述用户身份数据。
在本实施例中,用户数据提取是基于预设的配置信息中的各信息依赖关系实现的,能够确保数据提取任务可以稳定有序的执行。
可选的,所述配置信息还包括:字段映射关系;
所述方法还包括:
根据所述字段映射关系,依次对获取到的所述用户身份数据进行解析,提取所述用户身份数据具有的至少两个身份特征;
在第一方面的另一种可能设计中,所述根据所述用户身份数据具有的至少两个身份特征,构建图谱网络,包括:
以所述用户身份数据中的每个身份特征作为图谱网络的节点,以所述用户身份数据中的每两个身份特征的关联关系作为图谱网络的连接边,构建所述图谱网络,所述图谱网络中每个节点和每条连接边分别具有属性信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910831646.7/2.html,转载请声明来源钻瓜专利网。