[发明专利]一种用户画像标签值分析方法及装置有效
申请号: | 202010324872.9 | 申请日: | 2020-04-23 |
公开(公告)号: | CN111522828B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 贾丽;朱文彬;李佩刚;谭晓辉;王成 | 申请(专利权)人: | 中国农业银行股份有限公司 |
主分类号: | G06F16/23 | 分类号: | G06F16/23;G06F16/2458;G06N7/01 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 林哲生 |
地址: | 100005 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 画像 标签 分析 方法 装置 | ||
本发明公开了一种用户画像标签值分析方法及装置,通过建立用户画像标签的样本集合;根据所述样本集合,建立每一个所述间隔时间的转移矩阵;依据所述转移矩阵,计算获得标签值发生状态转移的概率之和;将所述概率之和与预设稳定性容忍参数进行比较,获得第一比较结果;基于所述第一比较结果,确定所述标签值的稳定性结果。本发明通过建立状态转移矩阵可以分析时间线上的概率趋势。从而可以应用在对标签值的稳定性分析,实现了保证了对标签值更新的时效性和准确性。
技术领域
本发明涉及信息处理技术领域,特别是涉及一种用户画像标签值分析方法及装置。
背景技术
随着信息化技术的快速发展,用户的各种数据主动或被动的海量增长。用户画像是当前学术界和产业界的研究热点,是真实用户的信息化描述方式。应用系统中的用户画像通常是以标签树森林的形式建立,每个树为一类标签。每一个叶节点标签可以有可数个标签值,各标签值互斥。例如,在客户风险这个标签类下,可以由客户风险偏好这一叶标签,其标签值可以为:保守型、稳健型、均衡型、激进型等。在以标签体系数为画像基础体系的用户画像体系中,有些标签取值与时间密切相关,例如:年龄阶段、保质期等等,这些标签未来的取值可与时间建立函数关系,计算出结果。
但是,大量的标签与时间的关系不具备必然规律性,需要定期更新标签值。标签值通常可以作为分析模型的数据源。为了避免过时的、不准确的标签值对分析决策带来误导,标签值的动态更新是至关重要的。常见的标签值更新方法包括手动更新核系统定期更新,其中,手工维护,人工工作量大,及时性、准确性无法保证。系统定期更新的方法,数据加工量随着标签精细度、客户数据增加、所加工的源数据呈正相关增长,时间消耗大。同时,基于更新后标签值的分析决策模型,均需要重新计算,连带的数据分析工作量大,数据时效性无法保证。
可见,现有的用户画像标签值分析方法无法保证标签值时效性和准确性。
发明内容
针对于上述问题,本发明提供一种用户画像标签值分析方法及装置,实现了保证了对标签值更新的时效性和准确性。
为了实现上述目的,本发明提供了如下技术方案:
一种用户画像标签值分析方法,所述方法包括:
建立用户画像标签的样本集合,所述样本集合包括用户叶标签对应的标签值、间隔时间和当前时间的关联统计数据;
根据所述样本集合,建立每一个所述间隔时间的转移矩阵;
依据所述转移矩阵,计算获得标签值发生状态转移的概率之和;
将所述概率之和与预设稳定性容忍参数进行比较,获得第一比较结果;
基于所述第一比较结果,确定所述标签值的稳定性结果。
可选地,所述方法还包括:
依据所述转移矩阵,计算获得每个所述标签值从第一时刻到第二时刻的转移概率值;
计算所述转移概率的均值,得到整体的转移概率;
根据所述整体的转移概率计算标签值取值变为预设取值的目标转移概率;
将所述目标转移概率与预设近似度参数进行比较,获得第二比较结果;
依据所述第二比较结果,确定在第二时刻的所述标签值对应的预测值。
可选地,所述基于所述第一比较结果,确定所述标签值的稳定性结果,包括:
若所述概率之和不大于所述预设容忍参数,确定所述标签值的取值为稳定性;
若所述概率之和大于所述预设容忍参数,确定所述标签值的取值为不稳定性。
可选地,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业银行股份有限公司,未经中国农业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010324872.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:通信装置的启动方法
- 下一篇:无牌车管理方法及相关设备