[发明专利]产品潜在用户挖掘方法及装置有效

专利信息
申请号: 201710686739.6 申请日: 2017-08-11
公开(公告)号: CN107657267B 公开(公告)日: 2021-11-09
发明(设计)人: 王婷婷;李明明 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06Q30/02
代理公司: 北京志霖恒远知识产权代理事务所(普通合伙) 11435 代理人: 陈姗姗
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 产品 潜在 用户 挖掘 方法 装置
【权利要求书】:

1.一种产品潜在用户挖掘方法,其特征在于,所述方法包括:

采集待预测用户数据;

针对所述待预测用户数据,利用基于机器学习算法预先建立的预测模型进行潜在用户的预测;以及

输出预测结果;

所述预测模型是通过下述步骤建立的:

生成训练样本和测试样本;

从所述训练样本和测试样本中分别抽取部分用户样本,采用随机森林算法建立预测模型;

所述生成训练样本和测试样本包括:

基于用户的产品开通时间,选择训练数据集和测试数据集;

所述基于用户的产品开通时间,选择训练数据集和测试数据集包括:

基于用户的开通产品时间,选择第一时间段内开通产品的用户数据为训练数据集,选择第二时间段内开通产品的用户数据为测试数据集;

其中,第一时间段的长度大于第二时间段的长度,且第一时间段的初始时间点晚于第二时间段的末端时间点。

2.根据权利要求1所述的方法,其特征在于,

打标分类所述训练数据集和测试数据集用户;

采集所述训练数据集和测试数据集用户的多维度特征,生成对应的特征指标;以及

整合所述训练数据集和测试数据集用户的打标分类结果及特征指标,对应生成训练样本和测试样本。

3.根据权利要求2所述的方法,其特征在于,所述打标分类所述训练数据集和测试数据集用户,包括:

基于产品收益参数,将所述训练数据集和测试数据集用户打标分类为正样本和负样本。

4.根据权利要求2-3任一项所述的方法,其特征在于,所述从所述训练样本和测试样本中分别抽取部分用户样本,采用随机森林算法建立预测模型包括:

从所述训练样本和测试样本中分别抽取部分用户样本,采用随机森林算法建立初始预测模型;

基于袋外数据分类准确率计算所述特征指标的重要度,并按重要度降序排列,选取排名靠前的部分特征指标作为重要特征指标,其余作为非重要特征指标,其中,所述袋外数据为训练样本和测试样本中未被抽取的用户样本;

删除所述训练样本和测试样本的非重要特征指标,沉淀所述训练样本和测试样本的重要指标特征;以及

使用所述沉淀后的训练样本和测试样本,重新采用随机森林算法建立预测模型。

5.根据权利要求1-3任一项所述的方法,其特征在于,所述待预测用户包括:

未曾开通过产品的在线用户。

6.一种产品潜在用户挖掘装置,其特征在于,所述装置包括:

数据采集单元,用于采集待预测用户数据;

预测单元,用于针对所述待预测用户数据,利用基于机器学习算法预先建立的预测模型进行潜在用户的预测;以及

输出单元,用于输出预测结果;

所述预测模型是通过下述装置建立的:

样本生成单元,用于生成训练样本和测试样本;所述生成训练样本和测试样本包括:基于用户的产品开通时间,选择训练数据集和测试数据集;

算法单元,用于从所述训练样本和测试样本中分别抽取部分用户样本,采用随机森林算法建立预测模型;

数据集选择单元,用于:

基于用户的开通产品时间,选择第一时间段内开通产品的用户数据为训练数据集,选择第二时间段内开通产品的用户数据为测试数据集;

其中,第一时间段的长度大于第二时间段的长度,且第一时间段的初始时间点晚于第二时间段的末端时间点。

7.根据权利要求6所述的装置,其特征在于,所述样本生成单元包括:

数据集选择单元,用于基于用户的产品开通时间,选择训练数据集和测试数据集;

打标分类单元,用于打标分类所述训练数据集和测试数据集用户;

特征采集单元,用于采集所述训练数据集和测试数据集用户的多维度特征,生成对应的特征指标;以及

整合单元,用于整合所述训练数据集和测试数据集用户的打标分类结果及特征指标,对应生成训练样本和测试样本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710686739.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top