[发明专利]字幕检测方法及装置、背景恢复方法及装置无效
申请号: | 200910118779.6 | 申请日: | 2009-03-11 |
公开(公告)号: | CN101835011A | 公开(公告)日: | 2010-09-15 |
发明(设计)人: | 贾国琛;严军;李甲;彭展;田永鸿;张毅 | 申请(专利权)人: | 华为技术有限公司;北京大学 |
主分类号: | H04N5/445 | 分类号: | H04N5/445 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 彭愿洁;李文红 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字幕 检测 方法 装置 背景 恢复 | ||
1.一种字幕检测方法,其特征在于,包括:
获取视频帧中像素区域属于平滑背景的概率;
使用帧间相关系数确定所述像素区域属于静止纹理的概率;
获取所述像素区域属于动态纹理的概率;
根据所述像素区域属于平滑背景的概率、属于静止纹理的概率和属于动态纹理的概率确定所述像素区域是否属于滚动字幕区域。
2.如权利要求1所述的字幕检测方法,其特征在于,确定所述像素区域属于滚动字幕区域后,该方法还包括:
将确定属于滚动字幕区域的像素区域的所在区域聚为滚动字幕区域;
计算所述滚动字幕区域的全局特征;
根据所述全局特征确定滚动字幕区域的运动特征;
根据所述运动特征确定所述滚动字幕区域在视频中的起始帧和终止帧。
3.如权利要求1所述的字幕检测方法,其特征在于,所述使用帧间相关系数确定所述像素区域属于静止纹理的概率的步骤包括:
计算帧间子带相关系数;
使用所述帧间子带相关系数确定帧间相关系数;
根据所述帧间相关系数确定所述像素区域属于静止纹理的概率。
4.如权利要求1至3任一所述的字幕检测方法,其特征在于,所述获取所述像素区域属于动态纹理的概率的步骤包括:
将所述视频帧的多级小波高频子带划分为宏块,所述宏块包括像素区域;
计算所述宏块与四邻域内宏块的关系;
根据所述宏块与四邻域内宏块的关系,计算所述宏块属于动态纹理的概率。
5.如权利要求4所述的字幕检测方法,其特征在于,所述宏块与四邻域内宏块的关系包括:边缘强度对比度、运动强度和方向对比度。
6.如权利要求1至3任一所述的字幕检测方法,其特征在于,所述获取视频帧中像素区域属于平滑背景的概率的步骤包括:
对所述视频帧进行多尺度的小波分解,获得小波分解区域,所述小波分解区域包括像素区域;
计算所述小波分解区域的边缘区域的平均强度值;
根据所述平均强度值确定所述小波分解区域是否属于平滑背景。
7.一种背景恢复方法,其特征在于,包括:
确定像素区域的周边像素区域的颜色值,所述像素区域属于文字区域;
使用所述颜色值进行线性插值,获得所述像素区域的颜色值;
使用所述像素区域的颜色值所对应的颜色对所述像素区域进行恢复。
8.如权利要求7所述的背景恢复方法,其特征在于,使用所述像素区域的颜色值所对应的颜色对所述像素区域进行恢复的步骤包括:
确定所述像素区域的恢复优先级;
按照恢复优先级的顺序,使用所述文字区域中各个像素区域颜色值对应的颜色对各个像素区域进行恢复。
9.如权利要求8所述的背景恢复方法,其特征在于,所述确定像素区域的恢复优先级的步骤包括:
计算所述像素区域属于文字区域的概率;
计算该像素区域的周边像素区域属于文字区域的概率;
根据所述像素区域属于文字区域的概率和所述周边像素区域属于文字区域的概率,确定所述像素区域的恢复优先级。
10.一种字幕检测装置,其特征在于,包括:
平滑背景概率获取单元,用于获取视频帧中像素区域属于平滑背景的概率;
静止纹理概率确定单元,用于使用帧间相关系数确定所述像素区域属于静止纹理的概率;
动态纹理概率获取单元,用于获取所述像素区域属于动态纹理的概率;
滚动字幕区域确定单元,用于根据所述平滑背景概率获取单元获取的像素区域属于平滑背景的概率、所述静止纹理概率确定单元确定的像素区域属于静止纹理的概率和所述动态纹理概率获取单元获取的所述像素区域属于动态纹理的概率,确定所述像素区域是否属于滚动字幕区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;北京大学,未经华为技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910118779.6/1.html,转载请声明来源钻瓜专利网。