[发明专利]一种获取多标签用户画像的方法和装置有效
申请号: | 201810148824.1 | 申请日: | 2018-02-13 |
公开(公告)号: | CN108229590B | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 张雅淋;李龙飞 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 标签 用户 画像 方法 装置 | ||
本说明书实施例公开了一种训练用户画像分类器的方法和装置以及获取多标签用户画像的方法和装置。所述训练方法包括:获取第一组用户的各自的第一特征向量;获取所述第一组用户各自的第一标签的值;以所述第一组用户各自的第一特征向量和第一标签的值的集合作为第一训练集,训练第一分类器;将所述第一组用户各自的第一特征向量和第一标签的值组合,以获取所述第一组用户各自的第二特征向量;获取所述第一组用户各自的第二标签的值;以及以所述第一组用户各自的第二特征向量和第二标签的值的集合作为第二训练集,训练第二分类器。
技术领域
本发明涉及机器学习领域,具体地,涉及一种训练用户画像分类器的方法和装置以及一种获取多标签用户画像的方法和装置。
背景技术
随着互联网的普及与发展,越来越多的数据可以被各个互联网运营商收集起来。例如,对于电商网站,可以获得用户的购买记录、浏览记录等信息;对于搜索引擎,可以获得用户的搜索记录、点击记录等信息。为了更好的利用这样的信息,以提供更为高效优质的服务,用户画像这一技术得到了普遍重视。用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。目前,现有技术中包括基于深度神经网络获取用户画像的方法和基于统计数据获取用户画像的方法等。因此,需要一种更有效的用于获取多标签用户画像的方案。
发明内容
本说明书实施例旨在提供一种更有效的获取多标签用户画像的方案,以解决现有技术中的不足。
为实现上述目的,本说明书一个方面提供一种训练用户画像分类器的方法,所述分类器是链式分类器,其包括第一分类器和第二分类器,所述用户画像为多标签用户画像,所述方法包括:获取第一组用户的各自的第一特征向量,所述第一特征向量对应于用户的信息,所述信息包括用户的注册信息、以及用户的操作历史信息;获取所述第一组用户各自的第一标签的值,所述第一标签的值对应于用户的第一标签信息;以所述第一组用户各自的第一特征向量和第一标签的值的集合作为第一训练集,训练第一分类器;将所述第一组用户各自的第一特征向量和第一标签的值组合,以获取所述第一组用户各自的第二特征向量;获取所述第一组用户各自的第二标签的值,所述第二标签的值对应于用户的第二标签信息,并且用户的第二标签与用户的第一标签相关联;以及以所述第一组用户各自的第二特征向量和第二标签的值的集合作为第二训练集,训练第二分类器。
在一个实施例中,在上述训练链式分类器的方法中,所述用户的信息包括用户的标签信息。
在一个实施例中,在上述训练链式分类器的方法中,第一标签是年龄,第二标签是购买偏好。
在一个实施例中,在上述训练链式分类器的方法中,第一标签是购买偏好,第二标签是购买能力。
本说明书另一方面提供一种训练用户画像分类器的方法,所述分类器是链式分类器,其包括第一分类器和第二分类器,其中所述第一分类器是通过上述训练方法训练获得的第一分类器,所述用户画像为多标签用户画像,所述方法包括:在训练第一分类器之后,获取第二组用户的各自的第一特征向量,所述第二组用户包括不属于所述第一组用户的至少一个用户,所述第一特征向量对应于用户的信息,所述信息包括用户的注册信息、以及用户的操作历史信息;将所述第二组用户的各自的第一特征向量输入所述第一分类器,以获取所述第二组用户的各自的第一标签预测值,将所述第二组用户中每个用户的第一特征向量和第一标签预测值组合,以获取第二组用户各自的第二特征向量;获取第二组用户各自的第二标签的值,所述第二标签的值对应于用户的第二标签信息,并且用户的第二标签与用户的第一标签相关联;以及以所述第二组用户各自的第二特征向量和第二标签的值的集合作为第三训练集,训练所述第二分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810148824.1/2.html,转载请声明来源钻瓜专利网。