[发明专利]端到端的视频推送方法、装置及电子设备在审
申请号: | 201910562971.8 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110287371A | 公开(公告)日: | 2019-09-27 |
发明(设计)人: | 许世坤;王长虎 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F16/732 | 分类号: | G06F16/732;G06F16/9535 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 陈龙 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 推送 标题文本 音频文件 视频帧 视频 装置及电子设备 目标视频 内容解析 推送系统 数据处理技术 多个目标 分类模型 目标对象 特征计算 视频库 预设 解析 | ||
1.一种端到端的视频推送方法,其特征在于,包括:
获取视频库中存在的一个或多个目标视频;
对所述目标视频包含的视频帧、音频文件及标题文本进行解析,得到多个不同类型的内容解析结果;
通过预设的分类模型对所述多个不同类型的内容解析结果进行特征计算,分别得到所述视频帧、所述音频文件及所述标题文本的特征向量;
将所述视频帧、所述音频文件及所述标题文本的特征向量作为推送系统的特征向量,以便于所述推送系统利用所述特征向量向目标对象推送所述目标视频。
2.根据权利要求1所述的方法,其特征在于,所述获取视频库中存在的一个或多个目标视频,包括:
从视频库中获取一个或多个待筛选视频;
判断所述待筛选视频的标签上是否存在推荐标记;
若存在,则将所述待筛选视频选择为目标视频。
3.根据权利要求1所述的方法,其特征在于,所述对所述目标视频包含的视频帧、音频文件及标题文本进行解析,得到多个不同类型的内容解析结果,包括:
对所述目标视频中的帧图像进行解析;
基于对目标视频中图像的解析结果,选择一个或多个视频帧;
将所述视频帧作为所述内容解析结果的组成部分。
4.根据权利要求3所述的方法,其特征在于,所述对所述目标视频包含的视频帧、音频文件及标题文本进行解析,得到多个不同类型的内容解析结果,还包括:
获取所述目标视频中包含的音频文件;
将所音频文件转换为音频频谱图;
将所述音频频谱图作为所述内容解析结果的组成部分。
5.根据权利要求4所述的方法,其特征在于,所述对所述目标视频包含的视频帧、音频文件及标题文本进行解析,得到多个不同类型的内容解析结果,包括:
获取所述目标视频中包含的标题文本,将所述标题文本作为所述内容解析结果的组成部分。
6.根据权利要求1所述的方法,其特征在于,所述通过预设的分类模型对所述多个不同类型的内容解析结果进行特征计算,分别得到所述视频帧、所述音频文件及所述标题文本的特征向量,包括:
采用预设的CNN模型对所述内容解析结果中的视频帧进行特征计算;
提取所述CNN模型中全连接层中形成的第一特征向量。
7.根据权利要求6所述的方法,其特征在于,所述通过预设的分类模型对所述多个不同类型的内容解析结果进行特征计算,分别得到所述视频帧、所述音频文件及所述标题文本的特征向量,还包括:
采用预设的CNN模型对所述内容解析结果中的音频频谱图进行特征计算;
提取所述CNN模型中全连接层中形成的第二特征向量。
8.根据权利要求7所述的方法,其特征在于,所述通过预设的分类模型对所述多个不同类型的内容解析结果进行特征计算,分别得到所述视频帧、所述音频文件及所述标题文本的特征向量,还包括:
采用预设的RNN模型对所述内容解析结果中的标题文本进行特征计算;
提取所述RNN模型中最后一个节点中形成的第三特征向量。
9.根据权利要求8所述的方法,其特征在于,所述将所述视频帧、所述音频文件及所述标题文本的特征向量作为推送系统的特征向量,以便于所述推送系统利用所述特征向量向目标对象推送所述目标视频,包括:
将所述第一特征向量、所述第二特征向量及所述第三特征向量作为所述目标视频的特征向量,直接增加到预设的推荐模型中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910562971.8/1.html,转载请声明来源钻瓜专利网。