[发明专利]利用支持向量机进行视频字幕定位和提取的方法无效
申请号: | 200410024680.7 | 申请日: | 2004-05-27 |
公开(公告)号: | CN1585458A | 公开(公告)日: | 2005-02-23 |
发明(设计)人: | 程治国;刘允才 | 申请(专利权)人: | 上海交通大学 |
主分类号: | H04N5/278 | 分类号: | H04N5/278;G06K9/66 |
代理公司: | 上海交达专利事务所 | 代理人: | 毛翠莹 |
地址: | 200240*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种利用支持向量机进行视频字幕定位和提取的方法,首先提取待检测视频图像像素特征,将其分成11×11像素的图像子块,并用“米”字形模型提取各个图像子块的像素灰度值作为支持向量机的输入,然后利用支持向量机工具LIBSVM构造支持向量机分类学习机,应用大量样本对支持向量机进行训练,使其能正确识别字幕块与非字幕块,再采用金字塔模型对原始图像分辨率逐次进行缩小,并在每一阶都单独使用支持向量机进行字幕检测,将各阶检测结果都还原到原始图像分辨率下合成,生成最终检测结果,最后对检测到的图像子块进行后期处理,清除噪声得到合并后的字幕区域。本发明采用学习机制处理视频字幕的多变因素,检测效率很高并有很强的鲁棒性。 | ||
搜索关键词: | 利用 支持 向量 进行 视频 字幕 定位 提取 方法 | ||
【主权项】:
1、一种利用支持向量机进行视频字幕定位和提取的方法,其特征在于包括如下具体步骤:1)提取待检测视频图像像素特征:首先将每幅视频图像分割为11×11的子块,对每一图像子块,标注为字幕块(+1)或者非字幕块(-1)两类;然后使用“米”字形模型提取像素的灰度值作为支持向量机的输入;2)构造并训练支持向量机:利用支持向量机工具LIBSVM,同时选择径向基函数作为支持向量机的核函数,从而构造出支持向量机分类学习机。然后对支持向量机进行训练,其方法为选择1000个11×11像素的字幕子块,对每一子块提取4×11-3像素值,并按其是否为字幕输入到支持向量机进行训练,使其能正确识别出字幕块与非字幕块;3)对待检测图像采用金字塔模型处理并应用于支持向量机识别:对原始图像采用金字塔模型,将其分辨率逐次进行缩小,每缩小一次,在每一阶都将原图像长宽缩小为原来的然后在每一阶都单独使用训练好的支持向量机进行字幕检测,最后将各阶的检测结果都还原到原始图像分辨率下予以合成,生成最终的检测结果,以备后期处理;4)图像后期处理:对每个图像子块作出是否为字幕块的分类判断后,根据字形学知识,对图像进行后期处理,以清除噪声并得到合并后的字幕区域。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200410024680.7/,转载请声明来源钻瓜专利网。