[发明专利]数据处理方法、设备、系统及存储介质在审

申请号：	201910977784.6	申请日：	2019-10-15
公开（公告）号：	CN112667869A	公开（公告）日：	2021-04-16
发明（设计）人：	吴铁民;王赛;陈晓勇;向师富;柯根	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G06F16/906	分类号：	G06F16/906;G06K9/62
代理公司：	北京太合九思知识产权代理有限公司 11610	代理人：	张爱;刘戈
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据处理方法设备系统存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供一种数据处理方法、设备、系统及存储介质。在本申请实施例中，根据多个关键属性之间的等级关系以及多个关键属性值之间的关联关系，识别出多个关键属性值中隶属于同一数据对象的属性值，完成了属于同一数据对象的不同属性下的属性值的纵向聚类。由于这种数据聚类方式，兼顾了多种关键属性，有利于降低错误聚类的概率，从而有助于提高对属于同一数据对象的数据进行识别的准确率。

技术领域

本申请涉及数据处理技术领域，尤其涉及一种数据处理方法、设备、系统及存储介质。

背景技术

随着信息时代的发展，各种信息的承载媒介日趋多样，如何实现对数据的有效管理也越来越重要。为了实现对企业数据的有效管理，企业可构建全域统一账号。

为了构建统一账号，需要从海量数据中识别出属于同一自然人的数据，但是现有的数据识别方式，准确率较低。

发明内容

本申请的多个方面提供一种数据处理方法、设备、系统及存储介质，用以提高数据识别的准确率。

本申请实施例提供一种数据处理方法，包括：

获取多条数据记录，所述多条数据记录包含多个关键属性下的多个关键属性值，每个关键属性值在同一时刻属于一个数据对象；

根据所述多个关键属性之间的等级关系以及所述多个关键属性值之间的关联关系，识别出所述多个关键属性值中隶属于同一数据对象的属性值；

输出所述多个关键属性值中隶属于同一数据对象的属性值。

本申请实施例还提供一种数据处理方法，包括：