[发明专利]识别静态视频的方法和系统有效
申请号: | 201980005872.8 | 申请日: | 2019-03-08 |
公开(公告)号: | CN111819837B | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 洪微;林盛怡 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | H04N5/232 | 分类号: | H04N5/232;H04N5/76;G06T7/269 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 肖华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 静态 视频 方法 系统 | ||
1.一种识别静态视频的方法,其特征在于,包括:
从输入视频的视频帧中获取输入视频帧,其中在接收到快门按下指示之前和在接收到所述快门按下指示之后,通过以下获取所述视频帧:
对于每个所述输入视频帧:
对所述输入视频帧进行下采样,以生成经下采样的视频帧;
对所述经下采样的视频帧进行平滑处理,以生成经平滑的视频帧;
计算所述经平滑的视频帧的时间梯度和空间梯度;
通过计算局部运动矢量来估计局部运动,所述局部运动矢量对应于来自所述经平滑的视频帧内的一个或多个候选像素块中的相应候选像素块,其中所述局部运动矢量是基于所述空间梯度和所述时间梯度的;
通过计算与所述经平滑的视频帧相对应的全局运动矢量来估计全局运动;
基于对应的局部运动矢量和全局运动矢量,计算一个或多个对象运动矢量;
将所述一个或多个对象运动矢量转换为得分映射;
基于所述得分映射计算熵得分;以及
将所述熵得分映射到与所述经平滑的视频帧相对应的对象运动得分;
基于所述输入视频帧的所述对象运动得分来识别所述输入视频帧的静态帧的数量;
如果静态帧的数量与所述视频帧的数量的比率满足静态帧阈值,则确定所述输入视频是静态视频,并且如果所述比率不满足所述静态帧阈值,则确定所述输入视频是运动视频;
如果所述输入视频被识别为所述静态视频,则进行第一操作,其中,所述第一操作包括将所述输入视频标记为静态,将对应于所述输入视频的快门图像保留在存储器中,以及从所述存储器中删除所述输入视频;并且
如果所述输入视频被识别为所述运动视频,则进行第二操作,其中,所述第二操作包括将对应于所述输入视频的快门图像和所述输入视频保留在所述存储器中。
2.如权利要求1所述的识别静态视频的方法,其特征在于,还包括在平滑之前将所述经下采样的视频帧从彩色转换成灰度级。
3.如权利要求1所述的识别静态视频的方法,其特征在于,计算所述经平滑的视频帧的所述空间梯度和所述时间梯度包括:
将所述经平滑的视频帧中的曝光不足的像素和所述经平滑的视频帧中的曝光过度的像素标记为无效;和
对于所述经平滑的视频帧内的有效像素:
计算时间梯度;
计算x方向上的空间梯度;和
计算y方向上的空间梯度。
4.如权利要求3所述的识别静态视频的方法,其特征在于,所述一个或多个候选像素块由以下确定:
在所述经平滑的视频帧内选择一个或多个网格点作为参考点,用于运动估计;
针对与所述一个或多个网格点中的每一个网格点对应的像素块选择像素块宽度和像素块高度;
计算每个像素块的统计信息;
确定所述像素块是否具有满足阈值纹理值的纹理;并且
如果所述像素块具有满足所述阈值纹理值的纹理,则将所述像素块识别为用于运动估计的候选像素块。
5.如权利要求1所述的识别静态视频的方法,其特征在于,计算所述局部运动矢量包括基于所述候选像素块中的像素的所述空间梯度和所述时间梯度来计算局部x运动值并计算局部y运动值。
6.如权利要求1所述的识别静态视频的方法,其特征在于,计算所述全局运动矢量包括基于有效局部运动矢量的平均值来计算所述全局运动矢量。
7.如权利要求1所述的识别静态视频的方法,其特征在于,计算所述一个或多个对象运动矢量包括从相应的局部运动矢量中减去所述全局运动矢量。
8.如权利要求1所述的识别静态视频的方法,其特征在于,将所述一个或多个对象运动矢量转换成所述得分映射包括对所述经平滑的视频帧内的像素的相应对象运动矢量的大小进行归一化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980005872.8/1.html,转载请声明来源钻瓜专利网。