[发明专利]一种基于全局运动统计特征的团队体育视频关键帧提取方法在审
申请号: | 202110204179.2 | 申请日: | 2021-02-24 |
公开(公告)号: | CN113032631A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 毋立芳;袁元;卢哲;杨洲;简萌;李则昱;朱青青 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06K9/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 全局 运动 统计 特征 团队 体育 视频 关键 提取 方法 | ||
1.一种基于全局运动统计特征的团队体育视频关键帧提取方法,其特征在于,包括下列步骤:
步骤1:通过一种基于颜色特征的团队体育视频比赛镜头提取方法提取比赛镜头视频片段;
输入:原始团队体育视频
输出:比赛镜头视频片段集合;
步骤2:提取每个镜头视频片段中视频帧的混合光流并估计全局运动;
输入:比赛镜头视频片段的视频帧
输出:视频帧对应的全局光流场;
步骤3:计算视频帧对应的全局运动统计特征,包括镜头缩放量和平移量;
输入:视频帧四个角点的全局光流值
输出:全局运动统计特征,包括镜头的缩放量和平移量;
其中矩形PtlPblPbrPtr代表原始镜头范围,矩形P’tlP’blP’brP′tr代表变换后的镜头范围;
式中Xzoom,Yzoom分别为镜头在X,Y方向上的缩放向量,MAGzoom则是镜头的合缩放量;(xtl,ytl),(xbr,ybr)分别为视频帧左上和右下角点的全局运动向量;
Xtrans=xtl-Xzoom
Ytrans=ytl-Yzoom
式中Xtrans,Ytrans分别为镜头在X,Y方向上的平移向量,DIStrans则是镜头的合平移量;
步骤4:基于镜头的水平平移量,将镜头视频片段进一步切分为细粒度视频片段;
输入:比赛镜头视频片段集合
输出:细粒度视频片段集合
Trans_con=SGN(Xtrans(FFamei)·Xtrans(FFamei+1))
其中SGN(x)函数返回x的符号,x>0,则SGN(x)=1;x=0,则SGN(x)=0;x<0,则SGN(x)=-1;Xtrans(FFamei),Xtrans(Framei+1)分别为第i帧,第i+1帧对应镜头在X方向上的平移向量;
具体操作:在每个镜头视频片段中,逐一计算第i帧与第i+1帧对应的Trans_con,如果Trans_con=-1,则分隔开第i帧与第i+1帧,直至计算到每个镜头视频片段的倒数第二个视频帧为止;之后将第一个间隔之前的帧存为第一个细粒度视频片段,之后将每两个间隔之间的帧存为相应的细粒度视频片段,最后一个细粒度视频片段由最后一个间隔之后的所有帧组成;
步骤5:绘制镜头合平移量和合缩放量的曲线,依据曲线的极大值提取每个细粒度视频片段中的候选关键帧;
输入:细粒度视频片段集合的所有视频帧
输出:候选关键帧集
步骤一):对每个细粒度视频片段,绘制视频帧序列的合缩放量变化曲线MAGzoom(f)以及合平移量变化曲线DIStrans(f),f为视频帧序列对应的帧号;
步骤二):同时扫描合平移量与合缩放量变化曲线;以合缩放量变化曲线为例,找到f1,f3,f2为连续的三个视频帧,如果MAGzoom(f3)>MAGzoom(f1)且MAGzoom(f3)>MAGzoom(f2),则f3为MAGzoom(f)曲线的一个极大值对应的帧号;DIStrans(f)曲线同理;若同帧号的f3既为MAGzoom(f)曲线的极大值对应的帧号,又是DIStrans(f)曲线的极大值对应的帧号,则把f3对应的帧选为关键帧;
步骤三):重复步骤二)直至查找完毕;
步骤四):遍历已经提取出的初步关键帧集,找到两帧k1,k2,如果k2-k1≥med则提取原细粒度视频片段帧集中帧号(表示对x向下取整)的视频帧,并存入按帧号大小排列的候选关键帧集中;
med取值:
篮球:35
足球:88
橄榄球:53
曲棍球:160
步骤五):重复步骤四)直至查找完毕;
步骤6:结合时空一致性与层次聚类从候选关键帧集中提取代表性关键帧,得到最终的关键帧集合;
输入:候选关键帧集
输出:最终关键帧集
基于时空一致性的代表性关键帧提取:
步骤一:将所有候选关键帧对应的全局光流场进行彩色编码,得到全局光流图像;
步骤二:将所有全局光流图像从RGB颜色空间转换至HSI颜色空间;
步骤三:将所有HSI颜色空间的全局光流图像按对应关键帧的时间序列进行排序;
步骤四:计算所有HSI颜色空间的全局光流图像对应的HI通道二维直方图;
步骤五:计算相邻图像HI通道二维直方图的巴氏距离B;
巴氏距离用于测量两个离散数据的概率分布;在直方图相似度计算时,巴氏距离具有很好的效果,其计算直方图相似度的公式如下:
其中,h1和h2为两个直方图,n为直方图组数,hi[m]表示第m组对应的频率;值越小,相关度越高,完全匹配为0,完全不匹配则为1;
步骤六:如果B>THB,检测这两幅相邻图像对应的关键帧是否被提取,如果未被提取,则提取未被提取的关键帧;
基于层次聚类的代表性关键帧提取:
步骤七:将所有全局光流图像按对应关键帧此前所在的细粒度视频片段进行分组,且按时间序列进行排序;
步骤八:计算每幅全局光流图像对应的RGB三通道直方图,并横向拼接为一个包含768个特征值的数组;
步骤九:对每组中所有全局光流图像对应的数组进行层次聚类,将簇间距离阈值设置为THHC;
步骤十:提取聚类后每一簇中,与每个数组距离最小的数组对应的关键帧;
步骤十一:检测每个细粒度视频片段的首末候选关键帧是否被提取,如果未被提取,则提取未被提取的关键帧;
步骤十二:将上述提取出的关键帧取并集,移除重复的关键帧;得到最终的关键帧集;
THB,THHC推荐取值:
高召回率:
篮球:THB=0.22,THHC=4.00
足球:THB=0.36,THHC=8.00
橄榄球:THB=0.17,THHC=9.00
曲棍球:THB=0.14,THHC=3.50
高F值:
篮球:THB=0.26,THHC=3.80
足球:THB=0.40,THHC=7.00
橄榄球:THB=0.20,THHC=6.50
曲棍球:THB=0.24,THHC=3.00
在统计比赛技术数据时,采用高召回率模式保证数据准确度,尽可能少地遗漏关键事件;而在快速浏览比赛内容以及存储视频时,则采用高F值模式。
2.根据权利要求1所述的一种基于全局运动统计特征的团队体育视频关键帧提取方法,其特征在于,
步骤1具体如下:
S={S1,S2,......,SS}:经过视频切分后的镜头视频片段集合;
F:镜头视频片段的视频帧集合;
AMR:视频帧中所有像素点对应R通道取值的算术平均值;
AMG:视频帧中所有像素点对应G通道取值的算术平均值;
AMB:视频帧中所有像素点对应B通道取值的算术平均值;
RR:镜头视频片段中AMR的极差;
RG:镜头视频片段中AMG的极差;
RB:镜头视频片段中AMB的极差;
镜头视频片段中所有视频帧对应AMR的算术平均值;
镜头视频片段中所有视频帧对应AMG的算术平均值;
镜头视频片段中所有视频帧对应AMB的算术平均值;
ARGB:将按行顺序堆叠的数组;
Cmax:经过K-means聚类后拥有镜头视频片段最多的一类;
THBS:用于区分候选基准镜头和所有其他镜头的阈值;
CBS:候选基准镜头视频片段集合;
SFM:CBS中具有视频帧数最多的镜头视频片段;
镜头视频片段SFM对应的
镜头视频片段SFM对应的
镜头视频片段SFM对应的
与的百分误差;
与的百分误差;
与的百分误差;
THGS:用于区分比赛镜头和非比赛镜头的阈值;
S’:比赛镜头视频片段集合;
步骤一:切分视频为视频镜头片段,并将视频按图片形式逐帧保存,得到S
步骤二:计算所有视频帧的AMR,AMG,AMB
步骤三:计算所有镜头视频片段的RR,RG,RB;和ARGB
步骤四:对所有镜头视频片段对应的ARGB进行K-means聚类,并找出Cmax
步骤五:对Cmax中所有镜头视频片段进行如下操作:如果RR,RG,RB中至少有一个小于等于THBS,则将该镜头视频片段存入CBS
步骤六:找到
步骤七:计算所有镜头视频片段的并对所有镜头视频片段进行如下操作:如果均小于等于THGS,则将其存入S’;
取值:THBS=100,THGS=15%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110204179.2/1.html,转载请声明来源钻瓜专利网。