[发明专利]一种智能识别视频中的数字区域的方法及装置在审
申请号: | 201810997149.X | 申请日: | 2018-08-29 |
公开(公告)号: | CN109409357A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 郭增洁 | 申请(专利权)人: | 无锡天脉聚源传媒科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;H04N21/234;H04N21/44 |
代理公司: | 北京尚伦律师事务所 11477 | 代理人: | 李蔚 |
地址: | 214000 江苏省无锡*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数字区域 视频 智能识别 判定 文本信息 预处理 智能信息服务 视频帧 分析 图像 | ||
本发明公开了一种智能识别视频中的数字区域的方法及装置。所述智能识别视频中的数字区域的方法,包括:对待识别的视频进行预处理;分析所述视频的视频帧中是否存在水平线;若存在所述水平线,根据所述水平线生成矩形判定区域;智能识别所述矩形判定区域内的图像的数字的文本信息;若存在所述数字的文本信息,则确认所述矩形判定区域为数字区域。本发明可以通过便捷高效的分析方式在较短的时间内识别出视频中的数字区域,为后续的智能信息服务提供可靠的保障。
技术领域
本发明涉及视频处理技术领域,特别涉及一种智能识别视频中的数字区域的方法及装置。
背景技术
视频,尤其是视频直播,已经广泛的扎根于网络时代的人们的日常生活中。某些视频直播的数字区域,例如足球比赛视频直播的分数牌,再例如短跑比赛视频直播的计时牌,再例如刀塔比赛视频直播的击杀助攻伤害统计区域,上述这些数字区域是具有巨大的实际意义的,计算机若可实时准确的获取到视频直播中的数字区域将为为后续的提取数字区域的图像中的数字信息提供了可靠的保障。但是由于视频直播的特性,使用现有的图像特征分析的技术,在视频直播中识别出数字区域所需要的运算量是非常巨大的,难以满足在较短识别时间内达到较高识别成功率的需求。如何妥善的处理上述问题,就成为了业界亟待解决的课题。
发明内容
本发明提供一种智能识别视频中的数字区域的方法及装置,用以较低的运算量并在较短的时间内识别出视频中的数字区域。
根据本发明实施例的第一方面,提供一种智能识别视频中的数字区域的方法,包括:
对待识别的视频进行预处理;
分析所述视频的视频帧中是否存在水平线;
若存在所述水平线,根据所述水平线生成矩形判定区域;
智能识别所述矩形判定区域内的图像的数字的文本信息;
若存在所述数字的文本信息,则确认所述矩形判定区域为数字区域。
在一个实施例中,所述对待识别的视频进行预处理,包括:
每间隔x帧获取所述视频的1帧视频帧,其中,获取的视频帧的数量为n;
对所述视频帧进行灰度处理;
对灰度处理后的视频进行高通滤波处理。
在一个实施例中,所述分析所述视频的视频帧中是否存在水平线,包括:
分析所述视频的视频帧中的纵轴方向的梯度信息;
判断是否存在同一纵轴坐标的连续的像素点标对应的纵轴方向的梯度值均大于预设的梯度阈值;
若上述判断为真,则确定所述视频的视频帧中是否存在水平线。
在一个实施例中,所述若存在所述水平线,根据所述水平线生成矩形判定区域,包括:
若存在所述水平线,获取所述水平线的长度和位置;
根据预设的长宽比,以所述水平线为一长边生成矩形;
确认所述矩形为矩形判定区域。
在一个实施例中,所述智能识别所述矩形判定区域内的图像的数字的文本信息,包括:
将所述矩形判定区域输入到预设的智能识别模型中;
所述预设的智能识别模型提取出所述矩形判定区域中的图像的文本信息。
根据本发明实施例的第二方面,提供一种智能识别视频中的数字区域的装置,包括:
预处理模块,用于对待识别的视频进行预处理;
分析模块,用于分析所述视频的视频帧中是否存在水平线;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡天脉聚源传媒科技有限公司,未经无锡天脉聚源传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810997149.X/2.html,转载请声明来源钻瓜专利网。