[发明专利]用户数据分类方法、装置、服务器和计算机可读存储介质有效
申请号: | 201710401985.2 | 申请日: | 2017-05-31 |
公开(公告)号: | CN107273454B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 赫南;朱顺;孙振鹏;杨旭;陈英杰;完灏;胡景贺;温园旭;李慧倩;李婵怡 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06Q30/02 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王洵 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 数据 分类 方法 装置 服务器 计算机 可读 存储 介质 | ||
本公开提供了一种用户数据分类方法,包括:产生用户数据的特征;根据标注规则,产生用户数据的标注数据集和未标注数据集;根据标注数据集和未标注数据集,构建多个类别中的一个类别的正样本标注数据集P和未知样本数据集U;根据正样本标注数据集P和未知样本数据集U以及相对应的用户数据的特征,产生分类器;使用分类器确定未标注数据集中的用户数据是否属于所述那一个类别。本公开通过改进的正例无样本标记学习算法对用户数据进行分类,适用于人群的特征提取,挖掘系统中相似人生阶段的人群,从而提供精准人群定向的电商广告。
技术领域
本公开涉及互联网技术领域,具体涉及一种用户数据分类方法、装置、服务器和计算机可读存储介质。
背景技术
市场研究者和社会学家近年来越发意识到,不同类别例如处于不同人生阶段的消费者表现出不同的购物行为。可以对消费者做一些粗粒度的人生阶段划分,例如,求学阶段(年轻人,且单身),新婚(年轻人,且没有小孩),中年(结婚,且有0或多个孩子),老年(年龄较高或退休,且子女独立生活)等。显然,即不同人生阶段(年龄段)的人表现出差异化的消费趋势。例如,怀孕的妇女会购买叶酸、维生素,妈妈们会根据婴儿的年龄段购买对应的商品,如奶粉、婴儿车、安全座椅、益智玩具等等。在电商网站的母婴频道、垂直类app中,消费者购买模式相当明显。可以在电商广告的精准人群定向业务和推荐系统中,引入消费者的人生阶段定向,从而可以获得更好的推荐效果。
但是在实现本发明的过程中,发明人发现现有技术至少存在如下技术问题:方法的有效性非常依赖训练数据的正确性和规模,同时,由于某些商品如母婴类商品由于其属性的标准特征,比如奶粉明确会注明适龄范围,本身已经有很强的人群定向,作为推荐应用未必合适。因此,需要一种对用户进行分类的方法及装置,能够更好地对用户进行分类,例如更准确可靠地挖掘电商系统中具有相同人生阶段的消费者的,从而服务于电商广告的精准人群定向。
发明内容
根据本公开的第一方面,提供了一种用户数据分类方法,所述方法包括:产生用户数据的特征;根据标注规则,产生用户数据的标注数据集和未标注数据集;根据所述标注数据集和未标注数据集,构建多个类别中的一个类别的正样本标注数据集P和未知样本数据集U;根据正样本标注数据集P和未知样本数据集U以及相对应的用户数据的特征,产生分类器;以及使用所述分类器确定未标注数据集中的用户数据是否属于所述那一个类别。
在一个实施例中,所述用户数据可以是电商用户数据,所述多个类别是多个人生阶段,例如母婴人生阶段。
在一个实施例中,所述方法还可以包括判断所述用户数据是否满足标注规则,如果满足则加入到标注数据集中,所述标注规则可以包括:如果用户数据指示只购买过一个人生阶段的商品,则将购买时间确定为该人生阶段的开始时间,如果用户数据指示购买过多个人生阶段的商品且按照时间顺序购买,则最后一次购买的时间确定相对应的人生阶段的开始时间,和/或如果用户数据指示购买过多个人生阶段的商品且没有按照时间顺序购买,则以最早的人生阶段为准,将属于该人生阶段的最早下单时间确定该人生阶段的开始时间。所述方法还可以包括,根据所确定的人生阶段的开始时间、每个人生阶段的持续时间和当前时间,确定用户数据当前属于哪个人生阶段。
在一个实施例中,所述特征可以包括购买商品的类目特征、人口属性特征以及时间特征,所述时间特征可以包括购买时间加权特征和与各个人生阶段有关的特征。
在一个实施例中,所述正样本标准数据集P可以包括标注数据集中属于所述类别的用户数据,未知样本数据集U包括由标注数据集中不属于所述类别的用户数据和未标注数据集中的用户数据组成的集合中的至少一部分,并且产生分类器可以包括以下步骤:
设置分类器M为空,并且可靠负样本集合RN为空;
从P中随机采样一部分用户数据S加入U,更新P和U,记为Ps=P-S,Us=U+S;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710401985.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:音乐播放的方法、终端及存储介质
- 下一篇:区块链数据访问方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置