[发明专利]数据处理方法、装置、设备及存储介质有效
申请号: | 202011255817.5 | 申请日: | 2020-11-11 |
公开(公告)号: | CN112232890B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 何远舵 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06N3/006 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 徐立 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
获取至少两个用户的用户画像数据,一个用户的所述用户画像数据包括至少两种数据;
基于所述至少两个用户的用户画像数据,获取目标随机森林,所述目标随机森林包括至少一个随机树,所述目标随机森林用于表示所述用户画像数据的分布情况;
获取第一用户和第二用户的目标用户画像数据;
对于所述目标随机森林中的一个随机树,按照所述随机树中所述至少两种数据的分类规则,分别基于所述第一用户和所述第二用户的目标画像数据,对所述第一用户和所述第二用户进行分类,得到所述第一用户和所述第二用户各自基于所述随机树分类的至少两个分类结果,将所述第一用户对应的至少两个分类结果组成第一路径,将所述第二用户对应的至少两个分类结果组成第二路径;
根据至少一个所述第一路径和至少一个所述第二路径之间公共路径的长度,确定所述第一用户和所述第二用户之间的相似度。
2.根据权利要求1所述的方法,其特征在于,所述基于所述至少两个用户的用户画像数据,获取目标随机森林,包括:
对所述至少两个用户的用户画像数据进行采样,得到至少一组用户的用户画像数据,一组用户为所述至少两个用户中的部分或全部用户;
基于所述至少一组用户的用户画像数据,生成至少一个随机树,将所述至少一个随机树组成所述目标随机森林,一组用户的用户画像数据对应一个随机树。
3.根据权利要求2所述的方法,其特征在于,所述基于所述至少一组用户的用户画像数据,生成至少一个随机树,包括:
对于一组用户的用户画像数据,依次根据所述用户画像数据中至少两种数据以及所述至少两种数据对应的分类规则,对所述一组用户进行分类,得到所述一组用户的至少两个分类结果,一个分类结果基于一种数据分类得到;
根据所述一组用户的至少两个分类结果,确定所述一组用户对应的随机树,所述随机树中一个节点对应一个分类结果。
4.根据权利要求3所述的方法,其特征在于,所述用户画像数据包括数值型的第一用户画像数据和非数值型的第二用户画像数据;
所述对于一组用户的用户画像数据,依次根据所述用户画像数据中至少两种数据以及所述至少两种数据对应的分类规则,对所述一组用户进行分类,得到所述一组用户的至少两个分类结果,一个分类结果基于一种数据分类得到,包括:
对于所述一组用户中的任一用户,响应于所述至少两种数据中任一种数据为数值型的第一用户画像数据,根据所述第一用户画像数据与目标阈值之间的大小关系,确定所述任一用户基于所述第一用户画像数据的分类结果;
响应于所述任一种数据为非数值型的第二用户画像数据,根据目标概率和所述第二用户画像数据,为所述第二用户画像数据进行分类,得到所述第二用户画像数据的分类结果,将所述第二用户画像数据的分类结果作为所述任一用户的一个分类结果。
5.根据权利要求3所述的方法,其特征在于,所述随机树的深度小于深度阈值;或者,所述随机树的叶子节点的数量小于数量阈值。
6.根据权利要求1所述的方法,其特征在于,所述根据至少一个所述第一路径和至少一个所述第二路径之间公共路径的长度,确定所述第一用户和所述第二用户之间的相似度,包括:
根据至少一个所述第一路径和至少一个所述第二路径,获取至少一个公共路径的长度,一个公共路径为同一随机树上的第一路径与第二路径重合的路径;
计算所述至少一个公共路径的长度的平均值;
将所述平均值作为所述第一用户和所述第二用户之间的相似度。
7.根据权利要求1所述的方法,其特征在于,所述根据至少一个所述第一路径和至少一个所述第二路径之间公共路径的长度,确定所述第一用户和所述第二用户之间的相似度,包括:
根据至少一个所述第一路径和至少一个所述第二路径,获取至少一个公共路径的长度,一个公共路径为同一随机树上的第一路径与第二路径重合的路径;
计算所述至少一个公共路径的长度之和;
将所述至少一个公共路径的长度之和作为所述第一用户和所述第二用户之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011255817.5/1.html,转载请声明来源钻瓜专利网。