[发明专利]一种视频热度预测方法和装置有效
申请号: | 201610682908.4 | 申请日: | 2016-08-17 |
公开(公告)号: | CN107766360B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 王磊 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/783;G06F16/75;G06F16/9535 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 热度 预测 方法 装置 | ||
1.一种视频热度预测方法,其特征在于,该方法包括:
选取多个视频样本;
对于每个视频样本,获取该视频样本对应的特征向量,获取该视频样本对应的热度类别,所述视频样本对应的特征向量反映出视频样本的属性信息,所述视频样本对应的热度类别反映出视频样本的热门程度;
根据各视频样本对应的特征向量和热度类别生成分类模型;
对于每个待预测的视频,获取该视频对应的特征向量,将该特征向量输入到所述分类模型中,根据所述分类模型的输出确定该视频的热度类别;
其中,所述获取该视频样本对应的特征向量包括:
采集该视频样本的视频属性信息,所述视频属性信息包括:片源属性信息和片源描述信息;
从所述片源属性信息中拆分出指示指定属性信息的字段,去重后得到M个字段,分别获取所述M个字段对应的权重,将所述M个字段对应的权重的集合作为第一特征向量;
对所述片源描述信息进行分词处理,去重后得到N个分词,分别获取所述N个分词对应的权重,将所述N个分词对应的权重的集合作为第二特征向量;
合并所述第一特征向量和所述第二特征向量,得到该视频样本对应的特征向量;
以及,在所述获取该视频样本对应的热度类别之前,该方法进一步包括:
获取各个视频样本在当前统计周期内的相对播放时长;
采用等量分箱算法对各个视频样本对应的相对播放时长进行热度类别的划分,得到热度类别与相对播放时长的对应关系;
则所述获取该视频样本对应的热度类别包括:根据该视频样本在当前统计周期内的相对播放时长以及所述热度类别与相对播放时长的对应关系,确定该视频样本对应的热度类别。
2.如权利要求1所述的方法,其特征在于,
所述合并所述第一特征向量和所述第二特征向量包括:为所述第一特征向量设置第一权重因子,为所述第二特征向量设置第二权重因子,将带有第一权重因子的第一特征向量和带有第二权重因子的第二特征向量进行合并;
所述分别获取所述M个字段对应的权重包括:通过词频-反文档频率统计算法分别计算每个字段在所述片源属性信息中所占的权重;
所述对所述片源描述信息进行分词处理包括:采用维特比算法对所述片源描述信息进行分词处理;
和/或,
所述分别获取所述N个分词对应的权重包括:通过词频-反文档频率统计算法分别计算每个分词在所述片源描述信息中所占的权重。
3.如权利要求1所述的方法,其特征在于,所述获取各个视频样本在当前统计周期内的相对播放时长包括:
对于每个视频样本,
采集该视频样本在每个预设单位时间内的播放时长并存入分布式文件系统中;
当当前统计周期结束时,从分布式文件系统中读取该视频样本在当前统计周期内的每个预设单位时间内的播放时长,累计计算得到该视频样本在当前统计周期内的播放总时长;
采集该视频样本的总时长,将该视频样本在当前统计周期内的播放总时长与该视频样本的总时长的比值作为该视频样本在当前统计周期内的相对播放时长。
4.如权利要求1所述的方法,其特征在于,
所述根据各视频样本对应的特征向量和热度类别生成分类模型包括:根据所述多个视频样本的特征向量和热度类别的对应关系,基于支持向量机算法生成分类模型;
该方法进一步包括:在所述根据各视频样本对应的特征向量和热度类别生成分类模型之后,为所述分类模型添加惩罚因子。
5.如权利要求1所述的方法,其特征在于,在对待预测的视频进行热度预测之前,该方法进一步包括:
选取多个视频检验样本;
对于每个视频检验样本,获取该视频检验样本对应的特征向量,获取该视频检验样本对应的热度类别;将该视频检验样本对应的特征向量输入到所述分类模型中,判断所述分类模型输出的热度类别与该视频检验样本对应的热度类别是否相同,是则确定所述分类模型输出正确,否则确定所述分类模型输出错误;
当所述分类模型的输出错误率高于预设阈值时,对所述分类模型进行优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610682908.4/1.html,转载请声明来源钻瓜专利网。