[发明专利]一种直播平台潜在用户的提取方法及装置有效
申请号: | 201810478885.4 | 申请日: | 2018-05-18 |
公开(公告)号: | CN108683949B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 林彬 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | H04N21/442 | 分类号: | H04N21/442;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 直播 平台 潜在 用户 提取 方法 装置 | ||
1.一种直播平台潜在用户的提取方法,其特征在于,包括:
获取直播平台主站用户中的多个待提取用户,多个所述待提取用户是过滤掉第一预设时间段内直播平台主站没有观影行为的用户并根据第一预设时间段内直播平台主站用户的观影行为数据确定的;
根据每个所述待提取用户在每个预设维度的特征值生成每个所述待提取用户的多维特征向量;
将每个所述待提取用户的多维特征向量输入到直播平台潜在用户提取模型中进行处理,得到多个直播平台潜在用户,其中,所述直播平台潜在用户提取模型为以直播平台中的多个活跃用户的多维特征向量作为正样本,以多个流失用户的多维特征向量作为负样本,对预设逻辑回归模型进行训练得到的,流失用户为在第三预设时间段内访问过直播平台,在第二预设时间段内未访问过直播平台且访问过直播平台主站的用户,所述第三预设时间段为所述第二预设时间段之前的一段时间。
2.根据权利要求1所述的方法,其特征在于,所述根据每个所述待提取用户在每个预设维度的特征值生成每个所述待提取用户的多维特征向量,包括:
提取每个所述待提取用户在每个预设维度的特征值;
分别对每个所述待提取用户在每个预设维度的特征值进行编码,得到每个所述待提取用户的多维特征向量。
3.根据权利要求1所述的方法,其特征在于,所述将每个所述待提取用户的多维特征向量输入到直播平台潜在用户提取模型中进行处理,得到多个直播平台潜在用户,包括:
将每个所述待提取用户的多维特征向量输入到直播平台潜在用户提取模型中进行处理,得到每个所述待提取用户的预测值;
将预测值大于预设值的待提取用户确定为直播平台潜在用户。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取直播平台中的多个活跃用户和多个流失用户;
生成每个所述活跃用户和所述流失用户的多维特征向量;
以每个所述活跃用户的多维特征向量作为正样本,以每个所述流失用户的多维特征向量作为负样本,对预设逻辑回归模型进行训练,得到直播平台潜在用户提取模型。
5.根据权利要求4所述的方法,其特征在于,所述获取直播平台用户中的多个活跃用户和多个流失用户,包括:
根据所述第二预设时间段内直播平台用户在直播平台的观影行为数据和/或所述直播平台用户在直播平台的消费行为数据,确定直播平台中的多个活跃用户;
将在所述第三预设时间段内访问过直播平台,在所述第二预设时间段内未访问过直播平台且访问过直播平台主站的用户,确定为所述直播平台中的流失用户。
6.根据权利要求4所述的方法,其特征在于,所述以每个所述活跃用户的多维特征向量作为正样本,以每个所述流失用户的多维特征向量作为负样本,对预设逻辑回归模型进行训练,得到直播平台潜在用户提取模型,包括:
对每个所述活跃用户的多维特征向量和每个所述流失用户的多维特征向量进行L1正则化处理,得到多维特征向量每个预设维度的权重;
根据多维特征向量每个预设维度的权重,在预设逻辑回归模型中对训练样本进行5-fold交叉验证,将潜在用户提取准确率最高的模型作为直播平台潜在用户提取模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810478885.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频内容信息互动的方法及装置
- 下一篇:一种智能频道排序的方法及系统