[发明专利]用于生成模型的方法和装置有效
申请号: | 201811273701.7 | 申请日: | 2018-10-30 |
公开(公告)号: | CN109492128B | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 袁泽寰;癿春光;王长虎 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F16/73 | 分类号: | G06F16/73;G06F16/783;H04L29/08 |
代理公司: | 11204 北京英赛嘉华知识产权代理有限责任公司 | 代理人: | 王达佐;马晓亚 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 初始模型 方法和装置 生成模型 视频特征 特征信息 视频 视频特征提取 训练步骤 自动选取 样本集 标注 响应 风格 申请 | ||
1.一种用于推送信息的方法,包括:
响应于接收到目标视频,将所述目标视频中的帧输入视频特征提取模型,得到所述目标视频的目标特征信息,其中,所述视频特征提取模型通过如下生成步骤生成:获取样本集,其中,所述样本集中的样本包括第一视频、第二视频和第三视频,第一视频和第二视频的配乐相同且带有相同的配乐风格标注,第一视频与第三视频的配乐不同且带有不同的配乐风格标注;从所述样本集中提取样本,执行如下训练步骤:将所提取的样本中的视频中的帧输入至卷积神经网络,得到样本中的各视频的特征信息;基于所得到的特征信息和样本中的配乐风格标注,确定样本的损失值;基于所述损失值确定卷积神经网络是否训练完成;响应于确定卷积神经网络训练完成,将训练后的卷积神经网络确定为视频特征提取模型;
将所述目标特征信息与预置的视频库中的视频的特征信息进行相似度计算,按照相似度从大到小的顺序,从所述视频库中选取预设数量的视频作为候选视频;
获取所述候选视频的配乐信息,将所选取的配乐信息进行推送。
2.根据权利要求1所述的方法,其中,所述基于所得到的特征信息和样本中的配乐风格标注,确定样本的损失值,包括:
确定第一欧氏距离和第二欧氏距离,其中,所述第一欧氏距离为带有相同的配乐风格标注的视频的特征信息的欧氏距离,所述第二欧氏距离为带有不同的配乐风格标注的视频的特征信息的欧氏距离;
确定所述第二欧氏距离与所述第一欧氏距离的差值;
基于所述差值与第一预设数值的比较,确定样本的损失值,其中,所述第一预设数值为正数。
3.根据权利要求2所述的方法,其中,所述基于所述差值与第一预设数值的比较,确定样本的损失值,包括:
响应于确定所述差值大于第一预设数值,将第二预设数值确定为样本的损失值,其中,所述第二预设数值小于所述差值与所述第一预设数值的差。
4.根据权利要求2所述的方法,其中,所述基于所述差值与第一预设数值的比较,确定样本的损失值,包括:
响应于确定所述差值不大于第一预设数值,将所述第一预设数值与所述差值的差确定为样本的损失值。
5.根据权利要求1所述的方法,其中,所述样本集中的样本通过如下步骤生成:
从预置的视频库中随机提取视频作为第一视频,其中,所述视频库中的视频带有配乐标注和配乐风格标注;
从所述视频库中随机提取与所述第一视频具有相同的配乐标注且具有相同的配乐风格标注的视频作为第二视频;
从所述视频库中随机选取与所述第一视频带有不同的配乐标注且具有不同的配乐风格标注的视频作为第三视频;
将所述第一视频、所述第二视频、所述第三视频汇总为样本。
6.根据权利要求1所述的方法,其中,所述生成步骤还包括:
响应于确定卷积神经网络未训练完成,基于所述损失值,更新卷积神经网络中的参数,从所述样本集中重新提取样本,使用更新参数后的卷积神经网络作为卷积神经网络,继续执行所述训练步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811273701.7/1.html,转载请声明来源钻瓜专利网。