[发明专利]一种用户群画像生成方法、装置及系统在审
申请号: | 202010187473.2 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111400599A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 史进 | 申请(专利权)人: | 苏宁金融科技(南京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 段晓玲 |
地址: | 211800 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 画像 生成 方法 装置 系统 | ||
本发明公开了一种用户群画像生成方法、装置及系统。其中所述方法包括:获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库;接收输入的至少一个目标标签;所述目标标签对应目标用户群;根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据;以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。本发明可准确快速进行用户群的画像生成。
技术领域
本发明涉及画像技术领域,具体涉及一种基于大数据的用户群画像生成方法、装置及系统。
背景技术
随着互联网技术的日益成熟,近些年互联网用户数量增长迅速。用户针对互联网创建和访问的信息数量呈指数级递增。互联网企业和各大产品厂家为了实现针对性的信息推送,需要采集数据进行数据分析,根据用户标签进行信息推送。
但面对数量如此庞大的用户和海量的访问数据,如何准确、快速的对用户行为数据进行分析以生成用户画像是目前急需解决的问题。
发明内容
本发明的目的在于提供一种用户群画像生成方法、装置及系统,实现准确快速的分析以生成用户画像,解决现有技术的问题。
为达此目的,本发明采用以下技术方案:
本发明第一方面公开一种用户群画像生成方法,所述方法包括:
获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库;
接收输入的至少一个目标标签;所述目标标签对应目标用户群;
根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据;
以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
优选的,所述以输入的至少一个分析维度为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像包括:
以每一所述分析维度为一次请求,通过高并发接口在所述搜索引擎数据库中进行查询获得所述分析维度的用户分布信息;
以所述分析维度的用户分布信息为基础,对所述目标用户群的数据进行聚类分析得到所述目标用户群画像。
优选的,所述方法还包括:
根据所述搜索引擎数据库中的标签数据在可视化界面中展示所有可选标签;
所述接收输入的至少一个目标标签包括:
接收在所述可视化界面从所述可选标签中选择的至少一个目标标签;
所述根据所有所述目标标签在所述搜索引擎数据库中进行查询获得目标用户群的数据包括:
按照预置的分类规则对所述目标标签进行分类;
根据所述目标标签的分类结果和预置的分类与语法的对应关系,确定每一所述目标标签的语法;
根据所述目标标签和对应的语法拼装查询语句,并根据所述查询语句在所述搜索引擎数据库中进行查询获得目标用户群的数据。
优选的,所述语法包括目标标签之间为取并集或目标标签之间为取交集。
优选的,所述获取用户的行为数据进行分析,根据分析结果对所述数据标注对应的标签后存入搜索引擎数据库包括:
获取用户的实时行为数据,对所述实时行为数据进行分析,根据分析结果对所述实时行为数据标注对应的准实时标签后存入所述搜索引擎数据库;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁金融科技(南京)有限公司,未经苏宁金融科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010187473.2/2.html,转载请声明来源钻瓜专利网。