[发明专利]一种视频字幕的提取方法及系统有效
申请号: | 202010356689.7 | 申请日: | 2020-04-29 |
公开(公告)号: | CN111539427B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 李钦;王正航 | 申请(专利权)人: | 深圳市优优品牌传播有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;H04N21/488 |
代理公司: | 成都鱼爪智云知识产权代理有限公司 51308 | 代理人: | 陈雄飞 |
地址: | 518000 广东省深圳市龙岗区南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 字幕 提取 方法 系统 | ||
1.一种视频字幕的提取方法,其特征在于,包括以下步骤:
选取视频画面中的特定区域作为字幕识别区域,并对视频画面中字幕颜色进行选取;
基于确定的字幕识别区域,对视频的每一帧画面进行裁剪,并基于图像识别算法,对每一帧画面的字幕识别区域进行识别,以判断每一帧画面的字幕识别区域是否含有字幕,以及判断前后相邻两帧画面的字幕识别区域是否相似;
基于判断结果,将视频中含有相同字幕且相邻的帧归为一组,并记录每组中首尾帧的时间戳;
对每组中首帧画面的字幕识别区域进行OCR,得到字幕,则当前组首尾帧的时间戳为当前得到字幕的开始时间戳和结束时间戳,并生成字幕文件;
其中,
所述判断每一帧画面的字幕识别区域是否含有字幕,其中,判断方式包括全局判断方式和局部判断方式;
所述全局判断方式包括以下步骤:
将当前帧画面的字幕识别区域转为灰度图像;
逐像素点读取灰度图像,得到灰度图像中灰度值属于[gray-15,gray+15]的像素点个数,gray为预设的灰度值,取值范围为0~255;
基于得到的个数,若得到的个数大于3*h,则表明当前帧画面的字幕识别区域含有字幕,反之,则表明当前帧画面的字幕识别区域不含有字幕,其中,h为灰度图像的高;
所述局部判断方式包括以下步骤:
使用预设裁剪区域对当前帧画面的字幕识别区域进行裁剪,得到裁剪图像;
将裁剪图像转为灰度图像,然后逐像素点读取灰度图像,得到灰度图像中灰度值属于[gray-15,gray+15]的像素点个数;
基于得到的个数,若得到的个数属于[cw,cw*ch/2],则表明当前帧画面的字幕识别区域含有字幕,反之,则表明当前帧画面的字幕识别区域不含有字幕,其中,cw表示裁剪图像的宽,ch表示裁剪图像的高。
2.如权利要求1所述的一种视频字幕的提取方法,其特征在于,所述使用预设裁剪区域对当前帧画面的字幕识别区域进行裁剪,其中,预设裁剪区域的确定步骤包括:
对每组中首帧画面的字幕识别区域横向切分,得到多个形状相同且均为正方形的单元区域,并使用数组进行存储,且每个数组存储一帧画面的字幕识别区域的单元区域中有效像素点个数;
对单个字幕识别区域中,每个单元区域的有效像素个数进行判断,若当前单元区域的有效像素个数满足[h1,h1*h/2],则当前单元区域的权重值相较于上一个单元区域的权重值加1,若当前单元区域的有效像素个数不满足[h1,h1*h/2],则当前单元区域的权重值与上一个单元区域的权重值保持一致,所述有效像素指灰度值属于[gray-15,gray+15]的像素点,h1为单元区域的边长;
对于当前帧画面字幕识别区域的所有单元区域,划分为左右两部分,并计算每部分单元区域的权重之和,然后判断|left-right|/min{left,right}是否大于0.1,若是,则当前帧画面为左对齐字幕,反之,则当前帧画面为居中对齐字幕,其中,left表示左部分单元区域的权重值之和,right表示右部分单元区域的权重值之和;
对于左对齐字幕的帧画面,找出单字幕识别区域中权重值最大的单元区域,以及与该单元区域相邻的后一个单元区域,将找出的两个单元区域合并后得到区域即为预设裁剪区域;对于居中对齐字幕的帧画面,找出单字幕识别区域中权重值最大的单元区域,以及与该单元区域相邻的前后两个单元区域,将找出的三个单元区域合并后得到区域即为预设裁剪区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优优品牌传播有限公司,未经深圳市优优品牌传播有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010356689.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于人工智能的种花器
- 下一篇:力与流场多技术联动测量控制方法及系统