[发明专利]目标群体分类方法及装置有效
申请号: | 202110216926.4 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112925990B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 阳文罡 | 申请(专利权)人: | 上海哔哩哔哩科技有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 刘晓楠 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 群体 分类 方法 装置 | ||
1.一种目标群体分类方法,其特征在于,包括:
获取目标群体的历史数据,并基于所述历史数据确定所述目标群体的多个待评估的特征组,所述特征组包含多个特征,其中,所述目标群体是指需要进行分类的群体;
针对所述多个待评估的特征组中的每个所述特征组,基于所述特征组对应的历史数据,对所述目标群体进行聚类,得到至少两个目标聚类簇,确定每个所述目标聚类簇对应的群体标签;
根据所述群体标签和预设评估规则对所述特征组的目标聚类簇进行评估,确定所述特征组对应的评估参数;
根据所述多个待评估的特征组对应的评估参数,从所述多个待评估的特征组中确定目标特征组。
2.根据权利要求1所述的目标群体分类方法,其特征在于,所述基于所述特征组对应的历史数据,对所述目标群体进行聚类,得到至少两个目标聚类簇,包括:
确定初始聚类数目;
根据所述特征组对应的历史数据,生成所述目标群体的聚类向量;
按照所述初始聚类数目对所述聚类向量进行聚类,得到所述初始聚类数目个聚类簇;
确定所述初始聚类数目个聚类簇的聚类误差;
令所述初始聚类数目自增预设值,返回执行按照所述初始聚类数目对所述聚类向量进行聚类,得到所述初始聚类数目个聚类簇的操作步骤,直至达到误差停止条件,得到所述至少两个目标聚类簇。
3.根据权利要求2所述的目标群体分类方法,其特征在于,所述按照所述初始聚类数目对所述聚类向量进行聚类,得到所述初始聚类数目个聚类簇,包括:
从所述聚类向量中选取所述初始聚类数目个参考向量,将所述初始聚类数目个参考向量作为聚类中心点;
根据其他向量与所述聚类中心点之间的距离,将所述其他向量分配至距离最近的聚类中心点,形成所述初始聚类数目个聚类簇,所述其他向量为所述聚类向量中除所述聚类中心点之外的向量;
计算所述初始聚类数目个聚类簇中每个所述聚类簇的质心,将所述质心作为聚类中心点,返回执行所述根据其他向量与所述聚类中心点之间的距离,将所述其他向量分配至距离最近的聚类中心点,形成所述初始聚类数目个聚类簇的操作步骤,直至满足聚类停止条件,得到所述初始聚类数目个聚类簇。
4.根据权利要求2所述的目标群体分类方法,其特征在于,所述确定所述初始聚类数目个聚类簇的聚类误差,包括:
针对所述初始聚类数目个聚类簇中的每个所述聚类簇,计算所述聚类簇中每个聚类向量与聚类中心点之间的误差距离,根据所述误差距离,确定所述聚类簇的聚类误差;
根据每个所述聚类簇的聚类误差,确定所述初始聚类数目个聚类簇的聚类误差。
5.根据权利要求2所述的目标群体分类方法,其特征在于,所述达到误差停止条件,包括:
根据当前初始聚类数目个聚类簇的聚类误差,以及前一个初始聚类数目个聚类簇的聚类误差,确定误差递减率;
在所述误差递减率小于预设阈值的情况下,确定达到所述误差停止条件。
6.根据权利要求1-5任一所述的目标群体分类方法,其特征在于,所述确定每个所述目标聚类簇对应的群体标签,包括:
确定所述目标聚类簇包括的目标群体的平均特征值;
根据预设特征规则和所述平均特征值,确定所述目标聚类簇的群体标签。
7.根据权利要求1-5任一所述的目标群体分类方法,其特征在于,所述评估参数包括留存率或跃迁率;所述根据所述群体标签和预设评估规则对所述特征组的目标聚类簇进行评估,确定所述特征组对应的评估参数,包括:
确定当前预设时长内所述至少两个目标聚类簇对应的初始评估数据,所述当前预设时长为获取所述历史数据的预设时长;
确定下一预设时长内所述至少两个目标聚类簇对应的更新评估数据;
根据所述初始评估数据、所述更新评估数据以及所述预设评估规则,确定所述特征组对应的评估参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110216926.4/1.html,转载请声明来源钻瓜专利网。