[发明专利]用于检测视频中的场景边界的由计算机实现的方法无效

申请号：	200810001375.4	申请日：	2008-01-16
公开（公告）号：	CN101247470A	公开（公告）日：	2008-08-20
发明（设计）人：	凯文·W·威尔森;阿贾伊·迪瓦卡兰;钮峰;纳韦恩·戈埃拉;大塚功	申请（专利权）人：	三菱电机株式会社
主分类号：	H04N5/14	分类号：	H04N5/14;H04N7/26;H04N7/52;G06T7/20
代理公司：	北京三友知识产权代理有限公司	代理人：	李辉
地址：	日本***	国省代码：	日本;JP
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于检测视频中的场景边界计算机实现方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于检测视频中的场景边界的由计算机实现的方法，该方法包括以下步骤：

从不同种类的视频中提取特征向量；以及

使用支持向量机将所述特征向量分类为场景边界，并且其中该支持向量机被训练为与所述视频的所述不同种类无关。

2.如权利要求1所述的方法，所述方法还包括以下步骤：

从所述视频的音频信号中提取听觉特征；

从所述视频的帧中提取视觉特征；以及

将所述听觉特征和所述视觉特征组合为所述特征向量。

3.如权利要求1所述的方法，其中所述视频被压缩。

4.如权利要求1所述的方法，所述方法还包括以下步骤：

反馈所述分类的结果以改进所述特征提取。

5.如权利要求1所述的方法，所述方法还包括以下步骤：

根据所述场景边界分割所述视频。

6.如权利要求1所述的方法，所述方法还包括以下步骤：

在训练视频中标注所述场景边界以训练所述支持向量机。

7.如权利要求2所述的方法，所述方法还包括以下步骤：

从所述音频信号中提取Mel频率倒谱系数(MFCC)；以及

将所述音频信号分类为语义类。

8.如权利要求7所述的方法，其中所述语义类包括音乐、语音、笑声和静音。

9.如权利要求8所述的方法，其中所述语音包括男声语音和女声语音。

10.如权利要求2所述的方法，其中所述视觉特征包括镜头边界。

11.如权利要求7所述的方法，其中每个特征向量包括：变量x₁，x₂，x₃，表示在持续时间[t-W_L，t]的时间窗内音频类标注的数量，其中W_L为大约14秒；变量x₄，x₅，x₆，表示在持续时间的窗内音频类的数目；以及变量x₇，x₈，x₉，表示在窗内的音频类的数目；变量x₁₀，x₁₁，分别是针对窗[t-W_L，t]和窗[t，t+W_L]的MFCC系数之间的巴氏形状和马氏距离；以及变量x₁₂，是在窗[t-W_L，t+W_L]中的视频内呈现的镜头边界的平均数的两倍。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社，未经三菱电机株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810001375.4/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N5-00 电视系统的零部件
H04N5-04 .同步
H04N5-14 .视频图像信号电路
H04N5-222 .电视演播室线路；电视演播室装置；电视演播室设备
H04N5-30 .转变光或模拟信息为电信号
H04N5-38 .发射机电路

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于检测视频中的场景边界的由计算机实现的方法无效

专利文献下载