[发明专利]目标群体分类方法及装置有效
申请号: | 202110216926.4 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112925990B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 阳文罡 | 申请(专利权)人: | 上海哔哩哔哩科技有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 刘晓楠 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 群体 分类 方法 装置 | ||
本申请提供目标群体分类方法及装置,其中所述目标群体分类方法包括:获取目标群体的历史数据,并基于历史数据确定目标群体的多个待评估的特征组,特征组包含多个特征;针对多个待评估的特征组中的每个特征组,基于所述特征组对应的历史数据,对目标群体进行聚类,得到至少两个目标聚类簇,确定每个目标聚类簇对应的群体标签;根据群体标签和预设评估规则对特征组的目标聚类簇进行评估,确定特征组对应的评估参数;根据多个待评估的特征组对应的评估参数,从多个待评估的特征组中确定目标特征组。如此,可以确定出基于不同特征组对目标群体进行分类的效果,然后选择效果最好的特征组用于后续分类操作,从而提高分类准确率和效率。
技术领域
本申请涉及数据处理技术领域,特别涉及一种目标群体分类方法。本申请同时涉及一种目标群体分类装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着计算机技术和网络技术的不断发展,直播平台渐渐走入了人们的生活,观众对于直播视频的喜爱程度与日俱增。每一个直播平台中都存在着大量的主播,不同的主播处于不同的生命周期阶段,各自的开播频率、营收能力、流量等都存在着一定差异。对处于不同生命周期的主播应该有针对性的手段进行运营或推荐,以期最大化的利用流量分发效率,促使各类主播都能不断成长,向更高的层级跃迁。
现有技术中,只能随机选取主播的某些维度特征对应的主播数据(如粉丝数、营收额等数据),或者选取主播的全部维度特征对应的主播数据;然后基于选出的主播数据对主播进行分类,从而得到不同生命周期的主播。然而,由于主播的某些维度特征和其所属的生命周期关联并不大,或不明显,因而随机选取的维度特征并不一定是划分主播生命周期最好的特征,因而基于随机选取的维度特征对应的主播数据对主播进行分类,分类的准确率较差。另外,若选取主播的全部维度特征对应的主播数据进行主播分类,则会导致计算量极其庞大,分类效率大大降低。
发明内容
有鉴于此,本申请实施例提供了一种目标群体分类方法。本申请同时涉及一种目标群体分类装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的分类准确率和效率较低的问题。
根据本申请实施例的第一方面,提供了一种目标群体分类方法,包括:
获取目标群体的历史数据,并基于所述历史数据确定所述目标群体的多个待评估的特征组,所述特征组包含多个特征;
针对所述多个待评估的特征组中的每个所述特征组,基于所述特征组对应的历史数据,对所述目标群体进行聚类,得到至少两个目标聚类簇,确定每个所述目标聚类簇对应的群体标签;
根据所述群体标签和预设评估规则对所述特征组的目标聚类簇进行评估,确定所述特征组对应的评估参数;
根据所述多个待评估的特征组对应的评估参数,从所述多个待评估的特征组中确定目标特征组。
根据本申请实施例的第二方面,提供了一种目标群体分类装置,包括:
获取模块,被配置为获取目标群体的历史数据,并基于所述历史数据确定所述目标群体的多个待评估的特征组,所述特征组包含多个特征;
第一确定模块,被配置为针对所述多个待评估的特征组中的每个所述特征组,基于所述特征组对应的历史数据,对所述目标群体进行聚类,得到至少两个目标聚类簇,确定每个所述目标聚类簇对应的群体标签;
第二确定模块,被配置为根据所述群体标签和预设评估规则对所述特征组的目标聚类簇进行评估,确定所述特征组对应的评估参数;
第三确定模块,被配置为根据所述多个待评估的特征组对应的评估参数,从所述多个待评估的特征组中确定目标特征组。
根据本申请实施例的第三方面,提供了一种计算设备,包括:
存储器和处理器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110216926.4/2.html,转载请声明来源钻瓜专利网。