[发明专利]基于观看行为预测用户在电视上追剧的方法有效
申请号: | 201711078604.8 | 申请日: | 2017-11-06 |
公开(公告)号: | CN107635143B | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 尹娟 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | H04N21/25 | 分类号: | H04N21/25;H04N21/258;H04N21/466 |
代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 吴中伟 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 观看 行为 预测 用户 电视 上追剧 方法 | ||
1.基于观看行为预测用户在电视上追剧的方法,其特征在于,包括以下步骤:
a.基于用户对电视的历史观看行为数据进行特征提取;
b.利用提取的数据制作数据集;
c.将制作的数据集输入至逻辑回归模型进行训练和验证;
d.利用训练和验证好的逻辑回归模型对用户的观看行为进行预测;
步骤a中,所述用户对电视的历史观看行为数据包括:
视频播放数据:包括用户进入视频播放器的时间轴、开启和退出某部视频的时间轴;
电视开关机数据:包括电视开机时间轴和关机时间轴;
媒资信息:为播放的视频信息,包括播放的视频名称、视频ID、视频系列ID、视频类型和简介;
所述特征提取,具体包括:
a1.将电视开机、关机时间轴和视频开启、退出时间轴转化成标准时间戳,并按时间戳升序排序,整合成按照时间序列化的数据;
a2.对无效数据进行清洗,所述无效数据包括:开机时间过短、视频播放时间过短的数据;
a3.根据清洗后的数据,提取能够计算出来的特征;
a4.对数据进行期望化处理,将数据期望值处理为0;
a5.采用主成分分析法从期望化处理后的数据中选取主要特征,并进行特征组合。
2.如权利要求1所述的基于观看行为预测用户在电视上追剧的方法,其特征在于,步骤d中,还包括:若预测到用户在追剧,则在下次开机后直接跳转至用户所追剧的最新观看进度进行视频播放。
3.如权利要求1所述的基于观看行为预测用户在电视上追剧的方法,其特征在于,步骤a3中,所述能够计算出来的特征包括:通过开关机时间轴计算开机时长、视频开启时间轴计算视频被开机后首先观看的次数;根据视频开启和退出的时间轴计算视频观看时长;根据视频的系列ID相同、视频ID不同来计算观看视频的集数,以及每天观看视频的部数。
4.如权利要求1所述的基于观看行为预测用户在电视上追剧的方法,其特征在于,步骤a4中,所述对数据进行期望化处理,将数据期望值处理为0具体包括:
从步骤a3提取的特征数据中,按行随机提取一定数量的特征数据,将抽取出来的特征数据按列为单位,求每一列的期望值,然后将该列中所有元素减去期望值,操作完成后,所有列的期望都为0,则整个特征数据矩阵的期望为0。
5.如权利要求1所述的基于观看行为预测用户在电视上追剧的方法,其特征在于,步骤a5中,采用主成分分析法从期望化处理后的数据中选取主要特征,并进行特征组合,具体包括:对特征数据矩阵做特征分解后得到矩阵的特征值列表,每个特征值对应一维特征向量,特征值越大,该维特征向量越重要,反之,特征值越小,该维特征向量越次要,取特征值最大的n维特征,作为主要特征,然后根据选取的主要特征之间的线性相关关系进行特征组合,从而确定最终的特征维度。
6.如权利要求5所述的基于观看行为预测用户在电视上追剧的方法,其特征在于,步骤b中,利用提取的数据制作数据集,具体包括:
b1.遍历所有电视在观测时间段内的所有数据,将每个电视观看的每部总集数大于10集的视频的所有主特征列出来,并按时间轴升序排列;
b2按照观看次数大于3次,观看集数大于5集,下一次开机观看了该视频定义为追剧,制作标签,若标签值为1,表明下一次开机继续观看了该视频,若标签值为0,表明下一次开机未观看该视频,将特征数据和标签数据对应关联;
b3.将特征数据归一化:求出每维特征的最大值,每维特征均除以最大值;
b4.调用sklearn库中的特征多项式扩展模块,将特征数据进行多项式扩展,扩展成多阶且相互关联的特征集合;
b5.构建空的训练数据集和验证数据集,然后将所有特征数据和标签数据按照7:1的比例随机分到训练数据集和验证数据集中;
b6.分别将训练特征数据、训练标签数据、验证特征数据、验证标签数据对应输出到4文本文件中。
7.如权利要求1-6任意一项所述的基于观看行为预测用户在电视上追剧的方法,其特征在于,步骤c中,所述将制作的数据集输入至逻辑回归模型进行训练时,在所述逻辑回归模型加入了二阶范数正则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711078604.8/1.html,转载请声明来源钻瓜专利网。