[发明专利]媒介分段系统和相关的方法有效
申请号: | 01123068.1 | 申请日: | 2001-07-30 |
公开(公告)号: | CN1359082A | 公开(公告)日: | 2002-07-17 |
发明(设计)人: | 林童;张洪江 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 蹇炜 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒介 分段 系统 相关 方法 | ||
技术领域
本发明涉及一种图象处理,更具体地说,是涉及一种媒介分段系统和相关的方法。
技术背景
随着近年来数据处理、存储及网络技术的发展,许多个人计算机系统有能力接收、处理和再现多媒体对象(例如音频、图象和视频内容)。例如,应用于多媒体再现领域的这种计算能力的一个示例,是使视频内容从一个远程服务器通过网络“流”到一个具有适当配置的计算系统,用于在该计算系统上再现。再现系统有很多种,所提供的功能类似于典型的视频盒式磁带放象机/录像机(VCR)。然而,随着计算能力的增强,消费者期望能有更先进的性能。这种期望的最初示例是快速访问相关媒介内容的能力。现有技术的系统尚不能满足这一期望。
为了适应和访问媒介庞大的数据量,目前可以采用各种图象数据库和视觉信息系统。这些系统已用于各种各样的应用装置,包括医学图象管理、CAD/CAM系统、罪犯识别系统、剪辑图库等等。现有技术的系统可能采用多种搜索技术之任一种,以访问及检索相关信息。这些现有技术的系统基本上是利用基于文本的、关键词方法对这种媒介内容进行编索引和检索。根据这一方法,每一帧(frame)、场面(shot)或场景(scene)(每一项包括一个或多个前者)被存储为数据库对象,其中数据库中的每一幅图象(例如帧、场面、场景)与人工产生的该对象的文字说明相关。于是采用逻辑查询可以检索这些关键词描述信息,其中的检索是基于对查询文本的精确匹配或概率匹配。
而这些现有技术系统的作用是激励了人们对这种技术的欲望,这些现有技术的系统中没有一个真正促进了基于内容的媒介搜索,因此未能全面地寻到所需的位置以访问和检索特定的媒介内容。专门基于文本的系统中存在几个问题。自动产生描述性关键词或提取建立分类层次所需的语义信息,已超出了当前计算图象和智能技术的能力。相应地,这种图象的文字描述应该是人工产生的。应该理解的是,人工输入关键词描述信息是冗长乏味的、耗费时间的过程,易于不精确和受描述的限制。而且,某些视觉特性,例如结构和图案的描述,如果不是不可能的话,也往往是难以充分地或精确地用一些文字说明来描述,特别是对于那些多用途的索引编制和检索应用装置而言。
而已讨论的其它方法试图基于内容对媒介定性地分段,所有方法的计算量是巨大的,结果,对于几乎是实时用户应用装置而言是不适用的。这些现有技术的方法一般都试图在各帧之间识别相似材料以检测出场面边界线。本领域技术人员可理解的是,场面边界线常常表示编辑点,例如摄像渐变,并不是语义的边界线。而且,由于所涉及的计算的复杂性,这种场面往往被定义为静态的,或在前的固定数量的帧,或是随后的编辑点(例如在先的三帧和后来的三帧)。在这方面,这种在先技术的系统一般都利用帧的固定窗口定义一个场面。
相反,场景包括语义上相似的场面,因此可包含多个场面边界线。相应地,在先技术的方法是基于两个场面之间帧的视觉相似性,往往不会产生好的效果,所需要的是对场面之间语义相关性的定量值。
因此,提出一种媒介分段系统和相关的方法,不受在先技术的系统一般常带有的局限性的妨碍。
本发明概述
本发明涉及一种媒介分段系统和相关的方法,便于实现在语义级对媒介内容的快速访问和检索。根据本发明的一个实施例,所提出的一种方法包括:接收媒介内容并分析所接收媒介的连续场面的一个或多个属性;至少是部分地根据对该一个或多个属性的分析,产生相对于每一个连续场面的相关值,其中实现场景分段,将语义上紧密结合的场面分组。
附图简述
在所有附图中相同的参考编号用于表示相同的部件和装置。
图1是含有本发明之思想的计算系统示例的方框图;
图2是根据本发明的一个实施例实现基于内容的场景分段的媒介分析工具之示例的方框图;
图3说明了根据本发明的一个方面表示颜色对象分段和跟踪;
图4说明根据本发明的一个方面表示扩展窗口场面分组技术;
图5说明根据本发明的一个方面的数据结构,该数据结构包括扩展场景窗口;
图6说明了根据本发明的一个方面的共生矩阵(co-occurrencematrices),它用于瞬间切片分析;
图7是根据本发明的一个实施例的用于基于内容的场景分段方法示例之流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/01123068.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:经人造或天然通道插入导管的进入件和系统及其更换法
- 下一篇:强健传输模式