[发明专利]一种相似视频的计算方法及装置在审
申请号: | 201810141011.X | 申请日: | 2018-02-11 |
公开(公告)号: | CN108228911A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 乔帅;王蕾 | 申请(专利权)人: | 北京搜狐新媒体信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标视频 视频 视频集合 权重 计算方法及装置 标签 集合 标签库 计算目标 计算效率 模型训练 预先设置 准确率 预设 申请 | ||
本申请公开了一种相似视频的计算方法及装置,方法包括:获得待计算的视频集合,视频集合中包括至少一个目标视频,目标视频具有至少一个标签;获得目标视频对应的目标视频集合,目标视频集合中包含至少一个待选视频,且待选视频与目标视频具有至少一个相同的标签;基于预设的标签库中标签对应的权重值,计算目标视频集合中每个待选视频与目标视频的相似权重值;根据相似权重值,确定目标视频集合中目标视频所对应的相似视频集合,相似视频集合中包括至少一个相似视频。本申请只需依靠预先设置的标签库及视频本身的内容来实现相似视频的计算,无需进行模型训练等操作,从而提高了计算效率及计算准确率。
技术领域
本申请涉及数据处理技术领域,特别涉及一种相似视频的计算方法及装置。
背景技术
目前,在计算相似视频文件时,通常基于协同过滤算法,利用用户的操作历史事件,如播放、点击、喜欢、分享、不喜欢等,再根据视频的特征计算出相似的视频。
但是以上基于协同过滤算法和视频特征的计算方案,往往局限于需要依赖大量的用户历史事件建立模型,而每次训练模型的建立都需要耗费较长的时间,训练好的模型再去利用视频特征进行计算,不仅会使得计算效率较低,还会使得计算的结果发生较大的偏差,造成两个视频内容完全无关却可能被计算成相似视频,造成准确率较低。
发明内容
有鉴于此,本申请的目的在于提供一种相似视频的计算方法及装置,用以解决现有技术中相似视频计算方案中计算效率较低且准确率较低的技术问题。
为解决以上技术问题,本申请提供了一种相似视频的计算方法,包括:
获得待计算的视频集合,所述视频集合中包括至少一个目标视频,所述目标视频具有至少一个标签;
获得所述目标视频对应的目标视频集合,所述目标视频集合中包含至少一个待选视频,且所述待选视频与所述目标视频具有至少一个相同的标签;
基于预设的标签库中标签对应的权重值,计算所述目标视频集合中每个所述待选视频与所述目标视频的相似权重值;
根据所述相似权重值,确定所述目标视频集合中所述目标视频所对应的相似视频集合,所述相似视频集合中包括至少一个相似视频。
上述方法,优选地,基于预设的标签库中标签的权重值,计算所述目标视频集合中每个所述待选视频与所述目标视频的相似权重值,包括:
确定所述目标视频集合中每个所述待选视频与所述目标视频相同的目标标签;
基于预设的标签库中标签对应的权重值,计算每个所述待选视频与所述目标视频的相似权重值,所述相似权重值为所述待选视频的目标标签对应的权重值之和。
上述方法,优选地,根据所述相似权重值,确定所述目标视频集合中所述目标视频所对应的相似视频集合,包括:
对所述目标视频集合中的待选视频按照其相似权重值的大小进行排序,得到排序结果;
在所述目标视频集合中,确定相似权重值排序在前M位的待选视频为所述目标视频的相似视频,所述相似视频组成所述目标视频对应的相似视频集合,M为大于或等于1的正整数。
上述方法,优选地,根据所述相似权重值,确定所述目标视频集合中所述目标视频所对应的相似视频集合,包括:
在所述目标视频集合中,确定相似权重值大于预设的权重阈值的待选视频为所述目标视频的相似视频,所述相似视频组成所述目标视频对应的相似视频集合。
上述方法,优选地,还包括:
根据所述目标视频的标签,在所述标签库中添加新标签。
上述方法,优选地,还包括:
对所述标签库中所述标签对应的权重值进行修改。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狐新媒体信息技术有限公司,未经北京搜狐新媒体信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810141011.X/2.html,转载请声明来源钻瓜专利网。