[发明专利]一种评估用户画像数据的方法及系统有效
申请号: | 201610683111.6 | 申请日: | 2016-08-18 |
公开(公告)号: | CN107767155B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 尹红军;张纪红;肖磊 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 马媛媛;王琦 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评估 用户 画像 数据 方法 系统 | ||
1.一种评估用户画像数据的方法,其特征在于,包括:
将用户画像数据集中各用户的数据根据其在至少一个第一维度上的值分入多个画像数据组,其中,所述用户画像数据集是多个用户的画像数据的集合,一个用户的画像数据包括该用户的多个维度的信息,所述多个画像数据组对应不同的取值范围;
根据各画像数据组中的用户信息得到所述用户画像数据集在至少一个第一维度上的分布信息,其中,所述分布信息描述所述至少一个第一维度的各种取值范围上分布的用户数目;
将样本数据集中各用户的数据根据其在所述至少一个第一维度上的值分入多个评估数据组,其中,所述多个评估数据组对应不同的取值范围,所述各评估数据组与所述各画像数据组为一一对应的关系,具有对应关系的画像数据组与评估数据组具有相同或相对应的取值范围;
根据所述各种取值范围上分布的用户数目和各评估数据组中用户的数目确定抽样比例;
根据所述各种取值范围上分布的用户数目与所述抽样比例确定需要从各取值范围对应的评估数据组中抽取的用户的数目,利用抽取出的用户的数据组成评估数据集;
其中,所述样本数据集中的用户数据与所述用户画像数据集中的数据来源不同,所述评估数据集中的数据在所述至少一个第一维度上的分布与所述分布信息描述的分布一致;
利用所述评估数据集中第二维度上的数据获得所述用户画像数据集中所述第二维度上的数据的准确度;
其中,所述抽样比例为以下值中的一个:
各评估数据组中用户数目与其对应的画像数据组中用户数目的比值按大小排列后处于预设位置的第一比值;或
预设的期望抽样数目与所述用户画像数据集中用户数目的比值与所述第一比值中较小的值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述各种取值范围上分布的用户数目与所述抽样比例确定需要从各取值范围对应的评估数据组中抽取的用户的数目包括:
所述需要从各取值范围对应的评估数据组中抽取的用户的数目等于各评估数据组对应的画像数据组中的用户数目与所述抽样比例的乘积。
3.根据权利要求1所述的方法,其特征在于,利用所述评估数据集中第二维度上的数据获得所述用户画像数据集中所述第二维度上的数据的准确度包括:
从所述用户画像数据集中选取与所述评估数据集中每个用户的用户标识相同的用户的画像数据,利用每个用户的画像数据与该用户在评估数据集中的评估数据形成该用户对应的样本对;
根据各样本对中画像数据与评估数据在所述第二维度上的差异获得所述用户画像数据集中所述第二维度上的数据的准确度。
4.根据权利要求3所述的方法,其特征在于,所述各样本对中画像数据与评估数据在所述第二维度上的差异包括以下中的一个:
在所述第二维度上所述画像数据的平均值与所述评估数据的平均值之间的差异;
在所述第二维度上所述画像数据的方差与所述评估数据的方差之间的差异;
在所述第二维度上所述画像数据的各种取值所占比率与所述评估数据的各种取值所占比率之间的差异;
所述各样本对中各用户的所述画像数据在所述第二维度上的数据组成的第一数据组与各用户的所述评估数据在所述第二维度上的数据组成的第二数据组之间的差异。
5.根据权利要求4所述的方法,其特征在于,根据各样本对中画像数据与评估数据在所述第二维度上的差异获得所述用户画像数据集中所述第二维度上的数据的准确度包括:
将所述差异与预设的阈值进行比较,根据比较结果确定所述准确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610683111.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:瓶贴
- 下一篇:瓶贴(儿童酿造酱油)
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置