[发明专利]人群画像方法及装置在审
申请号: | 202110711007.4 | 申请日: | 2021-06-25 |
公开(公告)号: | CN115526673A | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 高丽;陈婷;马振;李烨宣 | 申请(专利权)人: | 中移动金融科技有限公司;中移电子商务有限公司;中国移动通信集团有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 陈新生 |
地址: | 100037 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人群 画像 方法 装置 | ||
本发明提供一种人群画像方法及装置,该方法包括:获取候选标签集合,所述候选标签集合包括至少一个候选标签;将候选标签集合和人群对应的标签集合输入第一随机森林模型进行训练,训练结束后,获取所述候选标签在每个决策树内每个节点的基尼指数,基于所述候选标签在每个决策树内每个节点的基尼指数对所述候选标签集合进行筛选,得到典型标签;对所述典型标签的特征值进行区间分布处理,确定分布区间;基于所述分布区间对所述典型标签的特征值进行统计分布处理,生成人群画像。本发明极大提高人群画像的计算效率和精度,有效辅助运营人员自动实现人群画像。
技术领域
本发明涉及计算机技术领域,尤其涉及一种人群画像方法及装置。
背景技术
在定向营销场景中,运营商通常通过消息推送或个性化推荐等方式向用户推广业务,从海量用户中选择合适的目标用户是提升营销效果的关键。
目前主要采用人群画像和人群细分技术用于辅助运营人员筛选目标用户。人群画像和人群细分技术主要包括:(1)根据人工经验筛选候选用户特征标签;(2)基于候选用户特征标签的特征值,技术人员多次手动调整统计区间,分别统计目标人群和非目标人群的特征值分布,若二者存在区分,则基于候选用户特征标签的统计分布进行人群画像;(3)对步骤(1)和(2)进行迭代运算,筛选出具有显著区分性的候选用户特征标签及其统计分布,并构建目标用户的人群画像;(4)基于人工经验,采用用户特征标签维度和细分规则对目标人群进一步细分,得到多个目标细分人群,基于每一个目标细分人群的特征对目标细分人群制定不同的营销策略。
相关技术主要依赖大量复杂的人工探索,人群画像效率低,结果准确性不高。
发明内容
本发明提供一种人群画像方法及装置,用以解决相关技术主要依赖大量复杂的人工探索,人群画像效率低,结果准确性不高的缺陷。
第一方面,本发明提供一种人群画像方法,包括:
获取候选标签集合,所述候选标签集合包括至少一个候选标签;
将候选标签集合和人群对应的标签集合输入第一随机森林模型进行训练,训练结束后,获取所述候选标签在每个决策树内每个节点的基尼指数,基于所述候选标签在每个决策树内每个节点的基尼指数对所述候选标签集合进行筛选,得到典型标签;
对所述典型标签的特征值进行区间分布处理,确定分布区间;
基于所述分布区间对所述典型标签的特征值进行统计分布处理,生成人群画像。
在一个实施例中,所述基于所述候选标签在每个决策树内每个节点的基尼指数对所述候选标签集合进行筛选,得到典型标签,具体包括:
基于所述候选标签在每个决策树内每个节点的基尼指数计算所述候选标签在每个决策树所有节点的基尼指数变化量;
基于所述候选标签在每个决策树所有节点的基尼指数变化量计算所述候选标签的重要性值;
若所述候选标签的重要性值大于预设阈值,确定所述候选标签为典型标签。
在一个实施例中,所述基于所述候选标签在每个决策树内每个节点的基尼指数计算所述候选标签在每个决策树所有节点的基尼指数变化量,具体包括:
基于所述候选标签在每个决策树内每个节点的基尼指数利用公式(1)计算所述候选标签在每个决策树所有节点的基尼指数变化量:
其中,Xi表示第i个候选标签,j表示所述第一随机森林模型的第j个决策树,m表示第j个决策树的第m个节点,M表示第j个决策树总共有M个节点,表示第i个候选标签在第j个决策树所有节点的基尼指数变化量,表示第i个候选标签在第j个决策树的第m个节点的基尼指数变化量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移动金融科技有限公司;中移电子商务有限公司;中国移动通信集团有限公司,未经中移动金融科技有限公司;中移电子商务有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110711007.4/2.html,转载请声明来源钻瓜专利网。