[发明专利]用户属性的预测方法和装置有效
申请号: | 201710397613.7 | 申请日: | 2017-05-31 |
公开(公告)号: | CN107330445B | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 郑凯伦;申肆;李爱华 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;姜劲 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 属性 预测 方法 装置 | ||
本发明实施例提供一种用户属性的预测方法和装置,能够大幅提高用户属性预测的准确率和覆盖率。该方法包括:构建用于预测用户属性的特征数据;通过训练得到的并行二分类模型对所述特征数据进行处理,生成所述用户属性的预测概率值;通过训练得到的融合二分类模型对所述预测概率值进行处理,生成所述用户属性的预测结果。
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户属性的预测方法和装置。
背景技术
随着互联网技术的发展,基于海量用户数据进行用户属性预测越来越重要。现有的用户属性预测方法大多是基于无监督模型开发的,普遍存在覆盖率低、准确率低等问题。下面以用户性别预测为例,对现有的属性预测方法进行介绍。
图1是现有技术中的用户性别预测的示意图。如图1所示,现有用户性别预测主要包括两次迭代过程,步骤如下:S101、定义正则表达式对商品属性进行多次匹配,确定商品性别概率;S102、判断商品集中男性商品概率与女性商品概率的差值是否大于等于0.8,且商品性别属性标记量是否大于等于0.8;S103、若满足步骤S102中的判断条件,则基于朴素贝叶斯模型计算用户性别概率,然后进入步骤S105;S104、若不满足步骤S102中的判断条件,则对概率极值数据进行质量处理,然后进入步骤S103;S105、基于步骤S103中得到的用户性别概率对无性别标记的商品进行标记,然后进入步骤S101;S106、重复步骤S101至S103,得到用户的性别预测结果。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有的用户属性预测大多采用单一的无监督模型,只能通过商品的某些属性反推用户属性,其准确率、覆盖率较低。例如,在性别预测中,只能通过商品的性别属性反推用户的性别。但是,由于仅能通过商品中特有的性别词(如男、女等)去判断商品的性别属性,并且商品的性别属性较少,因此造成很多信息的缺失,导致最终性别预测的准确率较低。同时,现有性别预测方法的覆盖率较低,对相当大的一部分用户无法识别,且将部分用户识别为中性,大大影响了用户性别预测的适用范围。
发明内容
有鉴于此,本发明实施例提供一种用户属性的预测方法和装置,能够大幅提高用户属性预测的准确率,同时能够极大提高用户属性预测的覆盖率。
为实现上述目的,根据本发明的一个方面,提供了一种用户属性的预测方法。
本发明实施例的一种用户属性的预测方法,包括:构建用于预测用户属性的特征数据;通过训练得到的并行二分类模型对所述特征数据进行处理,生成所述用户属性的预测概率值;通过训练得到的融合二分类模型对所述预测概率值进行处理,生成所述用户属性的预测结果。
可选地,所述特征数据包括下列数据中的至少一项:用户购买商品的特征数据、用户浏览商品的特征数据、用户搜索商品的特征数据、用户将商品加入购物车的特征数据。
可选地,基于训练得到的并行二分类模型对所述特征数据进行处理,包括:将所述特征数据输入第一GBDT分类模型,生成第一预测概率值;将所述特征数据输入随机森林分类模型,生成第二预测概率值;通过第一GBDT分类模型和随机森林分类模型从所述特征数据中选出重要特征数据,并将所述重要特征数据输入逻辑回归分类模型,生成第三预测概率值。
可选地,所述融合二分类模型为:第二GBDT分类模型。
可选地,构建用于预测用户属性的特征数据,包括:获取用户在电子商务网站上的特征数据,并对所述特征数据进行清洗。
为实现上述目的,根据本发明的另一方面,提供了一种用户属性的预测装置。
本发明实施例的一种用户属性的预测装置包括:数据构建模块,用于构建用于预测用户属性的特征数据;并行处理模块,用于通过训练得到的并行二分类模型对所述特征数据进行处理,生成所述用户属性的预测概率值;融合处理模块,用于通过训练得到的融合二分类模型对所述预测概率值进行处理,生成所述用户属性的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710397613.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于生成对抗网络的图像自动文本标注方法
- 下一篇:一种密封性气阀装置