[发明专利]使用镜头持续时间相关来确定视频之间的相似性有效
申请号: | 201780066292.0 | 申请日: | 2017-09-28 |
公开(公告)号: | CN109964221B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 王永喆;安东尼·麦 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/738;G06F16/9535;G06V20/40;G06V10/74 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 镜头 持续时间 相关 确定 视频 之间 相似性 | ||
1.一种计算机实现的方法,所述方法包括:
识别第一视频中的第一多个镜头和第二视频中的第二多个镜头;
确定每个视频的经识别的镜头的镜头持续时间;
生成每个视频的直方图,每个直方图将对应视频的多个经识别的镜头划分成根据镜头持续时间的范围而划分的桶的集合;
确定每个直方图的桶的置信权重,桶的置信权重基于在该桶的镜头持续时间的范围内发生特定数量的经识别的镜头的可能性;
基于每个相应直方图的每个桶中的经识别的镜头的数量并且基于所述置信权重来计算两个视频的相关值;以及
基于将所述相关值与通过将所述第一视频的自相关值与所述第二视频的自相关值组合而获得的组合自相关值相比较来确定所述第一视频与所述第二视频之间的相似性。
2.根据权利要求1所述的方法,其中,所述识别第一视频中的第一多个镜头和第二视频中的第二多个镜头还包括:
针对所述第一视频和所述第二视频中的每一个视频:
识别该视频的帧的帧内分数,所述帧内分数指示该视频的帧之间的变化量;
确定所述帧内分数中的一个或多个指示该视频中的镜头边界;以及
识别该视频中的所述多个镜头,所述多个镜头中的镜头被该视频中的连续镜头边界分开。
3.根据权利要求1所述的方法,其中,所述确定每个视频的经识别的镜头的镜头持续时间还包括:
确定该视频的经识别的镜头内的帧的数量;以及
将经识别的镜头内的所述帧的数量确定作为所述镜头的镜头持续时间。
4.根据权利要求1所述的方法,其中,所述生成每个视频的所述直方图还包括:
识别镜头范围持续时间的连续序列;以及
将每个视频的经识别的镜头指派给每个视频的所述直方图的所述桶,所述直方图的所述桶对应于所述镜头范围持续时间,经识别的镜头被指派给所述桶,使得经识别的镜头的所述持续时间对应于所述桶的所述镜头范围持续时间。
5.根据权利要求1所述的方法,其中,所述确定每个直方图的桶的置信权重还包括:
确定每个直方图中的桶的镜头计数的概率,桶的镜头计数对应于指派给该桶的镜头的数量,该桶的所述概率指示视频在该桶的所述镜头持续时间范围内将具有等于该桶的所述镜头计数的数量的镜头的可能性;以及
确定所述直方图的所述桶的置信权重,桶的所述置信权重与该桶的所述镜头计数的所述概率具有反比关系。
6.根据权利要求5所述的方法,其中,桶的所述概率是基于确定所述镜头计数的泊松概率来进一步计算的,桶的所述泊松概率是基于具有该桶的所述镜头持续时间范围内的镜头持续时间的样本视频的集合中的镜头的平均镜头计数来计算的。
7.根据权利要求6所述的方法,其中,所述样本视频的集合是从内容存储中检索的并且与所述第一视频或所述第二视频中的至少一个视频共享一个或多个特性。
8.根据权利要求1-7中任一项所述的方法,其中,所述计算相关值还包括:
计算所述两个视频的每个直方图的桶的镜头计数的内积,桶的所述镜头计数对应于指派给该桶的镜头的数量,每个桶的所述镜头计数通过该桶的对应置信权重来修改。
9.根据权利要求1-7中任一项所述的方法,其中,每个视频的自相关值通过以下步骤来计算:
计算每个视频的直方图的桶的镜头计数与相同直方图的相同桶的所述镜头计数的内积,桶的所述镜头计数对应于指派给该桶的镜头的数量,每个桶的所述镜头计数通过该桶的对应置信权重来修改。
10.根据权利要求9所述的方法,其中,所述确定所述第一视频与所述第二视频之间的相似性还包括:
确定所述相关值与每个视频的自相关值的积的平方根之间的比较比率;以及
响应于确定所述比较比率高于阈值,确定所述两个视频是相似的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780066292.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种头像显示方法及终端
- 下一篇:用于处理具有多个点的输入点云的系统和方法