[发明专利]模型训练、线索排序方法、装置及设备在审
申请号: | 201811210047.5 | 申请日: | 2018-10-17 |
公开(公告)号: | CN111062736A | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 周丽芳;尹存祥;骆金昌;方军;钟辉强;吴晓晖 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 线索 排序 方法 装置 设备 | ||
1.一种模型训练方法,其特征在于,包括:
获取目标用户的数据;
将在获取所述数据之前的目标时长内,执行目标行为的所述目标用户作为正样本,未执行所述目标行为的所述目标用户作为负样本;
提取所述正样本的特征和所述负样本的特征;
根据所述正样本的特征和所述负样本的特征,对用于预测待预测用户在获取所述数据之后执行所述目标行为的概率的模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述目标行为包括购买行为、浏览行为和续费行为中的至少一个。
3.根据权利要求1所述的方法,其特征在于,还包括:
提取所述正样本的地域特征和所述负样本的地域特征;
按照所述地域特征对所述正样本和所述负样本进行分类,以便根据不同地域特征来训练不同的模型。
4.根据权利要求1所述的方法,其特征在于,所述获取目标用户的数据之前,还包括:
去除特殊用户、历史成单用户以及无联系方式用户,其中,所述特殊用户为不需要预测的用户。
5.根据权利要求1所述的方法,其特征在于,所述根据所述正样本的特征和所述负样本的特征,对用于预测待预测用户在获取所述数据之后执行所述目标行为的概率的模型进行训练,包括:
将所述正样本的特征和所述负样本的特征作为所述模型的输入,将所述目标用户在所述目标时长内是否执行目标行为的结果作为所述模型的输出,采用xgboost算法对所述模型进行训练。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述特征包括业务特征、ICP特征、用户工商特征、用户网站点击特征和用户名搜索特征,所述模型为意向度模型,
所述根据所述正样本的特征和所述负样本的特征,对用于预测待预测用户在获取所述数据之后执行所述目标行为的概率的模型进行训练,包括:
将所述业务特征、所述ICP特征、所述用户工商特征、所述用户网站点击特征和所述用户名搜索特征作为所述意向度模型的输入,对用于预测所述待预测用户在获取所述数据之后执行所述目标行为的概率的模型进行训练。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述特征包括ICP特征、用户工商特征、用户网站点击特征和用户名搜索特征,所述模型为潜力度模型,
所述根据所述正样本的特征和所述负样本的特征,对用于预测待预测用户在获取所述数据之后执行所述目标行为的概率的模型进行训练,包括:
将所述ICP特征、所述用户工商特征、所述用户网站点击特征和所述用户名搜索特征作为所述潜力度模型的输入,对用于预测所述待预测用户在获取所述数据之后执行所述目标行为的概率的模型进行训练。
8.一种线索排序方法,其特征在于,包括:
使用根据权利要求1至7中任一项所述的模型训练方法获得的所述模型,得到所述待预测用户在获取所述数据之后执行所述目标行为的概率;
根据所述概率对所述待预测用户进行排序。
9.一种模型训练装置,其特征在于,包括:
数据获取模块,用于获取目标用户的数据;
样本提取模块,用于将在获取所述数据之前的目标时长内,执行目标行为的所述目标用户提取为正样本,未执行所述目标行为的所述目标用户提取为负样本;
特征提取模块,用于提取所述正样本的特征和所述负样本的特征;
模型训练模块,用于根据所述正样本的特征和所述负样本的特征,对用于预测待预测用户在获取所述数据之后执行所述目标行为概率的模型进行训练。
10.根据权利要求9所述的装置,其特征在于,所述目标行为包括购买行为、浏览行为和续费行为中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811210047.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:LED远近光大灯模组
- 下一篇:一种用于河道监督的无人机