[发明专利]视频比分的检测识别方法及装置有效
申请号: | 201110193796.3 | 申请日: | 2011-07-12 |
公开(公告)号: | CN102254160A | 公开(公告)日: | 2011-11-23 |
发明(设计)人: | 苗广艺;张名举 | 申请(专利权)人: | 央视国际网络有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/36 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明 |
地址: | 100142 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 比分 检测 识别 方法 装置 | ||
技术领域
本发明涉及视频领域,具体而言,涉及一种视频比分的检测识别方法及装置。
背景技术
对于广播体育视频,比分的变化情况十分重要,它为视频的编辑和分析提供了非常有帮助的信息。对于大部分体育视频,都会有比分牌出现,比分牌上记录着随时变化的比分,得到比分信息可以帮助我们对视频进行标注和编目。例如,对于一个足球视频,得到比分信息后,可以将视频的进球时间点标注出来,并进一步帮助标注进球精彩片段,这些编目信息对于这个视频十分重要。
相关现有技术的比分检测识别方法包括如下两类:第一类是通过字符检测识别的传统方法来检测识别比分,另一类是根据先验的规律识别体育视频中比分牌上的时间或比分,在这两种方法中由于使用图像处理技术来检测每一帧图像中的文字,然后使用视频OCR技术识别文字,这种方法非常耗时,更重要的是,这种检测识别方法的准确率很低,并不能处理低分辨率情况,不适用足球视频的实际情况。
具体的,上述传统的字幕文字检测识别方法,需要在全屏图像上寻找文字区域,然后按照模式匹配找到两个队伍的比分区域,然后进行识别。这种方式具有如下缺陷:由于体育视频图像十分复杂,使用寻找文字区域然后再寻找比分区域时,准确率非常低;由于比分牌十分复杂,对于文字检测干扰非常大;由于面临着区分文字和比分的问题,导致比分检测不准或者无法检测到比分;而且由于现有的很多视频的分辨率相对较低,特别是比分数字的分辨率很低使得文字检测的过程比较耗时。
目前针对相关技术中足球视频比分的检测和识别准确率低且效率低的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中足球视频比分的检测和识别准确率低且效率低的问题,目前尚未提出有效的问题而提出本发明,为此,本发明的主要目的在于提供一种视频比分的检测识别方法及装置,以解决上述问题。
为了实现上述目的,根据本发明的一个方面,提供了一种视频比分的检测识别方法,该视频比分的检测识别方法包括:将视频画面中的静止区域和纹理丰富区域进行合并处理以得到候选比分牌区域;基于第一过滤条件对候选比分牌区域进行筛选以获取视频画面上的比分牌区域;将比分牌区域的比分牌图像进行分解,以获取比分牌图像中的文字区域;基于第二过滤条件对文字区域进行筛选和匹配,以获取比分牌区域的比分区域;通过结合粗识别算法和精识别算法来识别比分区域以获取比分数字。
进一步地,将视频画面中的静止区域和纹理丰富区域进行合并处理以得到候选比分牌区域之前,方法还包括:采用跳帧方式在视频画面中均匀提取预定数目的帧图像;获取各个帧图像之间的帧差,并将获取到的帧差进行二值化处理以获取帧差图;在帧差图上进行区域聚合运算,以获取静止区域。
进一步地,将视频画面中的静止区域和纹理丰富区域进行合并处理以得到候选比分牌区域之前,方法还包括:采用跳帧方式在视频画面中均匀提取预定数目的帧图像;计算并获取帧图像中每个像素的梯度绝对值;通过比较梯度绝对值和第一阈值来获取梯度图,其中,在梯度绝对值大于等于第一阈值的情况下,将梯度图中的像素标亮,否则将梯度图中的像素标暗;在梯度图上进行区域聚合运算,以获取纹理丰富区域。
进一步地,基于第一过滤条件对候选比分牌区域进行筛选以获取视频画面上的比分牌区域包括:计算候选比分牌区域在不同帧中的变化程度,当变化程度在预定范围内时,将持续的帧数最大的候选比分牌区域作为视频画面上的比分牌区域。
进一步地,在将视频画面中的静止区域和纹理丰富区域进行合并处理来获取候选比分牌区域之后,方法还包括:根据以下公式来获取预定数目的帧图像的比分牌模板:Tt(x,y)=Tt-1(x,y)×(1-k)+It(x,y)×k,其中,Tt(x,y)表示t帧时的模板像素,Tt-1(x,y)表示t-1帧时的模板像素,It(x,y)表示t帧时的图像像素值,k表示更新速度;根据比分牌模板检测任意图像帧中的是否出现比分牌,在出现比分牌时执行识别比分牌,并根据该公式更新比分牌模板。
进一步地,将比分牌区域的比分牌图像进行分解,以获取所有的文字区域包括:采用局部自适应阈值二值化算法对比分牌区域的比分牌图像进行二值化处理,以获取二值化区域;在二值化区域中进行文字特征筛选处理来得到文字区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于央视国际网络有限公司,未经央视国际网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110193796.3/2.html,转载请声明来源钻瓜专利网。