[发明专利]媒体数据中的低复杂度重复检测有效
申请号: | 201280061089.1 | 申请日: | 2012-12-10 |
公开(公告)号: | CN103999150B | 公开(公告)日: | 2016-10-19 |
发明(设计)人: | 巴尔巴拉·雷施;雷古纳森·拉达克里希南;阿里希特·比斯瓦斯;约纳什·恩德加德 | 申请(专利权)人: | 杜比实验室特许公司;杜比国际公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10H1/00;G06K9/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王萍;李春晖 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体 数据 中的 复杂度 重复 检测 | ||
相关的美国申请
本申请要求于2011年12月12日提交的美国临时专利申请第61/569,591号的优先权,其全部内容通过引用合并到本文中。本申请涉及于2010年12月30日提交的美国临时专利申请第61/428,578号、于2010年12月30日提交的美国临时专利申请第61/428,588号以及于2010年12月30日提交的美国临时专利申请第61/428,554号,其每个的全部内容通过引用合并到本文中。
技术领域
本发明总体上涉及媒体。更具体地,本发明的实施方式涉及媒体数据中的代表性片段的时间位置的低复杂度检测。
背景技术
媒体数据可以包括能够给收听者或观看者留下持久印象的代表性片段。例如,最流行的歌曲遵循在主歌部与副歌部之间交替的特定结构。通常,副歌部是歌曲中的最重复的部,也是歌曲中“吸引人的”部分。副歌部的位置通常与基本的歌曲结构有关,并且可以用于方便终端用户浏览歌曲收藏。
从而,在编码侧,代表性片段比如副歌部的位置可以在媒体数据比如歌曲中被标识,并且可以作为元数据与歌曲的编码比特流相关联。在解码侧,元数据使得终端用户能够在副歌部的位置处开始回放。当存储器处的媒体数据的合集比如歌曲合集被浏览时,副歌回放方便已知歌曲的即时识别和标识以及对于歌曲合集中未知歌曲的喜欢或不喜欢的快速评定。
在“聚类方法”(或状态方法)中,可以使用聚类技术将歌曲分割成不同部。基本的假定是:歌曲的不同部(比如主歌、副歌等)共享将一个部与其他部或歌曲的其他部分区分开的某些属性。
在“模式匹配方法”(或序列方法)中,假定副歌是歌曲中的重复部。重复部可以通过对歌曲的不同部进行相互匹配来识别。
“聚类方法”和“模式匹配方法”两者均要求根据输入音频剪辑计算距离矩阵。为了这样做,将输入音频剪辑划分成N个帧;从每个帧提取特征。然后,在输入音频剪辑的N个帧中的任意两个帧之间形成的总数的对中的每对帧之间计算距离。该矩阵的获得在计算上是昂贵的,并且要求高的存储器使用率,因为需要针对所有组合中的每个和逐个组合计算距离(这意味着N×N次的数量级,其中N是歌曲或输入音频剪辑中的帧的数量)。
该部分中所描述的方法是可以实行的方法,但不一定是前面已经设想或实行的方法。因此,除非另外指出,不应当假定该部分中所描述的方法中的任何方法仅由于它们包括在该部分中而视为现有技术。类似地,关于一个或更多个方法所识别的问题不应当假定已经基于该部分而在任何现有技术中被识别,除非另外指出。
附图说明
作为示例而非作为限制在附图中的多个图中示出了本发明,在附图中相似的附图标记指代相似的元素,在附图中:
图1A图示了根据本发明的实施方式的媒体处理系统的示例基本框图;
图1B图示了根据本发明的实施方式的通过若干迭代计算的示例距离矩阵;
图2图示了根据本发明的示例实施方式的示例媒体数据比如具有副歌部之间的偏移的歌曲;
图3图示了根据本发明的示例实施方式的示例距离矩阵;
图4图示了根据本发明的示例实施方式的粗声谱图的示例生成;
图5图示了根据本发明的示例实施方式的音调的示例螺旋;
图6图示了根据本发明的示例实施方式的示例频谱;
图7图示了根据本发明的示例实施方式的提取示例色度(chroma)的示例梳状图样;
图8图示了根据本发明的示例实施方式的将帧的谱乘以梳状图样的示例操作;
图9图示了根据本发明的示例实施方式的与在有限的频率范围上计算的色度图有关的第一示例加权矩阵;
图10图示了根据本发明的示例实施方式的与在有限的频率范围上计算的色度图有关的第二示例加权矩阵;
图11图示了根据本发明的示例实施方式的与在有限的频率范围上计算的色度图有关的第三示例加权矩阵;
图12图示了根据本发明的示例实施方式的使用感知激励的BPF的与具有钢琴信号(具有逐渐增大的八度音的音符)的形式的示例媒体数据相关联的示例色度图图示;
图13图示了根据本发明的示例实施方式的与图12中所示的钢琴信号相关联的但是使用高斯加权的示例色度图图示;
图14图示了根据本发明的示例实施方式的媒体处理系统的示例详细框图;
图15图示了根据本发明的示例实施方式的包括指纹查询序列的示例指纹;
图16图示了根据本发明的示例实施方式的偏移值的示例直方图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司;杜比国际公司,未经杜比实验室特许公司;杜比国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280061089.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于叠加的配重块
- 下一篇:一种便于取放的配重块
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置