[发明专利]一种基于对象的视频转码方法和装置有效

专利信息
申请号: 201210093888.9 申请日: 2012-04-01
公开(公告)号: CN102630043A 公开(公告)日: 2012-08-08
发明(设计)人: 肖炳珠;魏东亮;郝晔明 申请(专利权)人: 北京捷成世纪科技股份有限公司
主分类号: H04N21/2343 分类号: H04N21/2343
代理公司: 暂无信息 代理人: 暂无信息
地址: 100191 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 对象 视频 方法 装置
【权利要求书】:

1.一种基于对象的视频转码方法,其特征在于包括如下步骤:

步骤一、对输入视频流进行完全解码;

步骤二、检测视频图像中文字区域并定位区域坐标;

步骤三、利用坐标信息将整幅视频图像分为两个部分,一部分为文字区域,另一部分为非文字区域;

步骤四、对于文字区域进行隔离,对于非文字区域,采用彩色图像锐化进行增强;

步骤五、对于两部分区域分别进行编码,并对两部分进行图像融合产生重新转码之后的图像。

2.根据权利要求1所述的基于对象的视频转码方法,其特征在于步骤二具体为:先将待转码视频解码为YUV格式,对Y分量计算图像边缘,并计算整个图像的边缘密度,得到一幅边缘密度图像,利用otsu的方法对密度图进行分割并进行膨胀腐蚀操作,得到候选文字区域,然后,利用事先训练好的SVM文字分类器进行识别,进而定位文字区域并得到区域坐标大小。

3.根据权利要2所述的基于对象的视频转码方法,其特征在于步骤四中对图像进行增强的步骤具体包括:利用高斯滤波器对Y分量图像进行滤波得到滤波图像F,将图像Y和F做差得到差分图像,再将差分图像乘以一个放大系数,最后将差分图像叠加到滤波图像上就得到了最终的边缘增强图像。

4.根据权利要1所述的基于对象的视频转码方法,其特征在于步骤5中对文字区域进行编码的具体步骤为:根据文字区域的位置信息,取得相应宏块的位置,然后对有文字的宏块进行单独的编码。

5.一种基于对象的视频转码装置,其特征在于包括如下模块:

解码模块,用于对输入视频流进行完全解码;

文字区域定位模块,用于检测视频图像中文字区域并定位区域坐标;

图像分割模块,用于利用坐标信息将整幅视频图像分为两个部分,一部分为文字区域,另一部分为非文字区域;

彩色图像增强模块,用于对于文字区域进行隔离,并对于非文字区域,采用彩色图像锐化进行增强;

编码模块,用于对于两部分区域分别进行编码,并对两部分进行图像融合产生重新转码之后的图像。

6.根据权利要求5所述的基于对象的视频转码装置,其特征在于文字区域定位模块:先将待转码视频解码为YUV格式,对Y分量计算图像边缘,并计算整个图像的边缘密度,得到一幅边缘密度图像,利用otsu的方法对密度图进行分割并进行膨胀腐蚀操作,得到若干后选文字区域,然后利用事先训练好的SVM文字分类器进行识别,进而定位文字区域并得到区域坐标大小。

7.根据权利要5所述的基于对象的视频转码装置,其特征在于彩色图像增强模块利用一个高斯滤波器对Y分量图像进行滤波得到滤波图像F,将图像Y和F做差得到差分图像,在将差分图像乘以一个放大系数,最后将差分图像叠加到滤波图像上就得到了最终的边缘增强图像。

8.根据权利要5所述的基于对象的视频转码装置,其特征在于所述编码模块根据文字区域的位置信息,取得到相应的宏块的位置,然后对有文字的宏块进行单独的编码。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷成世纪科技股份有限公司,未经北京捷成世纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210093888.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top