[发明专利]一种基于自适应模板的视频OSD时间识别方法有效
申请号: | 201510102516.1 | 申请日: | 2015-03-09 |
公开(公告)号: | CN104657721B | 公开(公告)日: | 2018-09-25 |
发明(设计)人: | 陈远浩 | 申请(专利权)人: | 上海依图网络科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 徐颖聪 |
地址: | 200240 上海市松江区北*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 模板 视频 osd 时间 识别 方法 | ||
1.一种基于自适应模板的视频OSD时间识别方法,其特征在于,包括以下步骤:
1)对视频帧中的OSD时间区域进行定位,获得若干候选区域;
2)在各候选区域中,采用深度神经网络方法对时间字符进行定位及识别,根据设定时间段内的识别结果确定一个最终识别区域,具体为:
a)在视频帧图像中找到单一颜色的联通区域;
b)在联通区域上采用扫描窗口的方法,对每个窗口进行字符识别,保留置信度大于设定置信度阈值的窗口;
c)检索同时满足如下条件的六个窗口:
i)在同一水平线上,ii)相同间隔,iii)构成数字满足时间约束;
d)判断步骤c)是否检索到满足条件的六个窗口,若是,则执行步骤e),若否,则减小设定置信度阈值,返回步骤b);
e)判断检索到满足条件的六个窗口的组合数据是否大于1,若是,则选择其中字符识别置信度最高的一组为最终定位结果,若否,则直接以检索到的六个窗口为最终定位结果;
3)根据所述最终识别区域生成多个字符模板,各字符模板记录每个字符的前景和背景区域;
4)利用所述字符模板对待识别视频帧进行时间识别,并获得对应的识别置信度。
2.根据权利要求1所述的基于自适应模板的视频OSD时间识别方法,其特征在于,所述步骤1)中,采用Boosting方法和先验参数检测时间字符所在区域,对OSD时间区域进行定位。
3.根据权利要求2所述的基于自适应模板的视频OSD时间识别方法,其特征在于,所述先验参数包括区域长宽比和区域位置。
4.根据权利要求1所述的基于自适应模板的视频OSD时间识别方法,其特征在于,所述步骤3)中,根据步骤2)获得的多帧深度神经网络定位和识别的字符生成字符模板。
5.根据权利要求1所述的基于自适应模板的视频OSD时间识别方法,其特征在于,所述步骤4)中,根据字符模板对待识别视频帧进行时间识别时,将各个字符模板应用到待识别视频帧上,统计每个字符模板下前景的灰度值方差,取方差最小的字符模板作为识别结果,并用该方差作为对应的识别置信度。
6.根据权利要求1所述的基于自适应模板的视频OSD时间识别方法,其特征在于,该方法还包括:
判断识别置信度是否小于设定值,若是,则根据上一视频帧的识别结果修正当前视频帧的识别结果,若否,则退出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图网络科技有限公司,未经上海依图网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510102516.1/1.html,转载请声明来源钻瓜专利网。