[发明专利]基于大数据的用户画像构建方法、装置及存储介质在审
申请号: | 202110294601.8 | 申请日: | 2021-03-19 |
公开(公告)号: | CN113051324A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 孙圣力;陈忠毅;李青山;司华友 | 申请(专利权)人: | 南京博雅区块链研究院有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28;G06K9/62 |
代理公司: | 无锡永乐唯勤专利代理事务所(普通合伙) 32369 | 代理人: | 孙际德 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 用户 画像 构建 方法 装置 存储 介质 | ||
本发明提供了一种基于大数据的用户画像构建方法、装置及存储介质,其中的方法包括:建立用户画像标签体系;采集用户数据并存储至数据仓库内预先构建好的实体表和事实表内;将实体表和事实表进行ID‑Mapping关联以实现对用户数据的聚合;基于用户画像标签体系,对于每一个标签,从数据仓库中获取与所述标签相关的用户数据处理后保存至用户画像数据库。本发明采用数据仓库技术实现对海量用户数据的存储及处理,提高了大数据时代对海量数据的处理需求。此外,本发明采用包括机器学习算法在内的数据挖掘工具实现对非结构用户数据的处理,从而获得更加丰富的标签数据,提升了用户画像的标签丰富度。
技术领域
本发明涉及大数据领域,具体而言,本申请涉及一种基于大数据的用户画像构建方法及装置。
背景技术
在互联网步入大数据时代后,用户行为给企业的产品和服务,带来了一系列的改变和重塑,其中最大的变化在于,用户的一切行为在企业面前是可“追溯”,“分析”的。企业内保存了大量的原始数据和各种业务数据,这是企业经营活动的真实记录,如何更加有效地利用这些数据进行分析和评估,成为企业基于更大数据量背景的问题所在。随着大数据技术的入研究与应用,企业的关注点日益聚焦在如何利用大数据来为精细化运营和精准营销服务,而要做精细化运营,首先要建立本企业的用户画像。
用户画像,即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。用户画像可看作企业应用大数据的根基,是定向广告投放与个性化推荐的前置条件,为数据驱动运营奠定了基础。由此看来,如何从海量数据中挖掘出有价值的信息越发重要。
当前的用户画像系统构建过程中,存在着海量非结构数据难以存储,标签开发形式单一,企业数据开发人员与业务人员交流困难等问题。
发明内容
为了解决上述技术问题中的至少一个,本发明第一方面提供了一种基于大数据的用户画像构建方法,其具体技术方案如下:
一种基于大数据的用户画像构建方法,其包括:
建立用户画像标签体系;
采集用户数据并将采集到的用户数据存储至数据仓库内预先构建好的实体表和事实表内,所述用户数据包括结构化用户数据和非结构化用户数据;
将实体表和事实表进行ID-Mapping关联以实现对用户数据的聚合;
基于用户画像标签体系,对于每一个标签,从数据仓库中获取与所述标签相关的用户数据处理后保存至用户画像数据库。
在一些实施例中,在所述用户画像标签体系中,从用户自然属性、行为属性、风险属性三个方面构建用户全面的用户画像。
在一些实施例中,所述采集用户数据并将采集到的用户数据存储至数据仓库内包括:在数据仓库内预先创建实体表和事实表,所述实体表用于存储用户的自然属性数据,所述事实表用于存储用户行为数据;根据用户画像标签体系,梳理需要采集的用户数据并形成数据埋点需求,数据埋点在客户端和服务器端进行数据采集;将采集到的用户数据分类存储至数据仓库内预先创建的实体表和事实表内。
在一些实施例中,所述事实表包括事务事实表、周期快照事实表及累计快照事实表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京博雅区块链研究院有限公司,未经南京博雅区块链研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110294601.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置