[发明专利]一种用户群画像生成方法、装置及系统在审
申请号: | 202010187473.2 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111400599A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 史进 | 申请(专利权)人: | 苏宁金融科技(南京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 段晓玲 |
地址: | 211800 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 画像 生成 方法 装置 系统 | ||
1.一种用户群画像生成方法,其特征在于,所述方法包括:
获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库;
接收输入的至少一个目标标签;所述目标标签对应目标用户群;
根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据;
以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
2.如权利要求1所述的方法,其特征在于,所述以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像包括:
以每一所述分析维度为一次请求,通过高并发接口在所述搜索引擎数据库中进行查询获得所述分析维度的用户分布信息;
以所述分析维度的用户分布信息为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述搜索引擎数据库中的标签数据在可视化界面中展示所有可选标签;
所述接收输入的至少一个目标标签包括:
接收在所述可视化界面从所述可选标签中选择的至少一个目标标签;
所述根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据包括:
按照预置的分类规则对所述目标标签进行分类;
根据所述目标标签的分类结果和预置的分类与语法的对应关系,确定每一所述目标标签的语法;
根据所述目标标签和对应的语法拼装查询语句,并根据所述查询语句在所述搜索引擎数据库中进行查询获得目标用户群的数据。
4.如权利要求3所述的方法,其特征在于,所述语法包括目标标签之间为取并集或目标标签之间为取交集。
5.如权利要求1所述的方法,其特征在于,所述获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库包括:
获取用户的实时行为数据,对所述实时行为数据进行分析,根据分析结果对所述实时行为数据标注对应的准实时标签后存入所述搜索引擎数据库;
获取用户的离线行为数据,对所述离线行为数据进行分析,根据分析结果对所述离线行为数据标注对应的离线标签后存入所述搜索引擎数据库。
6.如权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
判断所述用户当前新标注的标签是否在搜索引擎数据库中具有同一字段的历史标签;
若有,则判断新标注的标签是否与所述历史标签不同;
若不同,则根据所述用户标识,利用所述新标注的标签更新所述历史标签。
7.如权利要求5所述的方法,其特征在于,所述方法:
通过kafka获取所述用户的实时行为数据并对所述实时行为数据进行分析;
通过大数据平台对所述离线行为数据进行分析;
所述搜索引擎数据库为ES搜索引擎数据库。
8.一种用户群画像生成装置,其特征在于,所述装置包括:
数据获取单元,用于获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库;
目标标签单元,用于接收输入的至少一个目标标签;所述目标标签对应目标用户群;
查询单元,用于根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据;
聚类分析单元,用于以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁金融科技(南京)有限公司,未经苏宁金融科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010187473.2/1.html,转载请声明来源钻瓜专利网。