[发明专利]鲁棒的媒体指纹有效

专利信息
申请号: 200980133072.0 申请日: 2009-08-26
公开(公告)号: CN102132341A 公开(公告)日: 2011-07-20
发明(设计)人: C·鲍尔;R·拉达克里希南 申请(专利权)人: 杜比实验室特许公司
主分类号: G10L19/00 分类号: G10L19/00
代理公司: 中国国际贸易促进委员会专利商标事务所 11038 代理人: 杨小明
地址: 美国加*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 媒体 指纹
【说明书】:

相关美国申请

本申请要求于2008年8月26日提交的美国专利临时申请No.61/091,979的优先权。另外,本申请与于2007年10月5日提交的共同未决的美国专利临时申请No.60/997,943相关。特此通过引用并入这两篇申请的全文。

技术领域

本发明整体涉及媒体。更具体地讲,本发明的实施例涉及音频(声学)指纹。

背景技术

音频媒体包括本质上普遍存在的现代活动特征。多媒体内容(例如最现代的电影)包括多于一种类型的媒体,例如包括其视频内容和音频声道(soundtrack)二者。几乎每一类型的现代企业和许多行业的个人以多种独特且相关的方式使用音频媒体内容。娱乐、商务和广告、教育、教学和培训、计算和联网、广播、企业和电信仅仅是在其中音频媒体内容找到普遍使用的几个现代行为的例子。

音频媒体包括记录在各个光盘(CD)上或者以其它存储格式记录的、通过网络在服务器和客户端计算机之间作为数字文件流传输的、或者通过模拟和数字电磁信号传输的音乐、语音和声音。发现用户在移动、上下班往返途中等时用iPodsTM、MP3播放器和CD听音乐已变得与在家中用娱乐系统、或者其它更固定的音频再现装置或较不固定的音频再现装置听音乐一样熟悉。流行乐队的演唱会在互联网上被流传输,并被用户作为音频欣赏和/或还在演出网播中被观看。极其便携的重量轻的、规格小的、成本低的数字音频文件播放器已广泛普及。现在本质上普遍存在的蜂窝电话、以及个人数字助理(PDA)和手持计算机都具有通用的功能。不仅电信装置,而且现代蜂窝电话也接入互联网,并从互联网流传输音频内容。

互联网的广泛且日益增长的使用的结果是,非常大量的音频媒体内容存在。考虑到存在大量的各种音频媒体内容并且该内容随着时间扩大增长,识别内容的能力是有价值的。媒体指纹包括识别媒体内容的技术。媒体指纹是从其提取或生成它们的媒体内容的唯一标识符。从比如在法医学上通过人类指纹唯一地识别人类的意义上来讲,术语“指纹”适用于表示这些媒体内容标识符的唯一性。尽管与签名类似,但是媒体指纹可能甚至更密切地并且更可识别地对应于内容。音频媒体和视频媒体均可使用与每种媒体对应的媒体指纹来识别。

可通过音频指纹识别音频媒体,这里音频指纹比如可互换地称为声学指纹。从特定音频波形生成作为与该波形唯一地对应的代码的音频指纹。本质上,音频指纹从音频或声学波形推导得到。例如,音频指纹可包括音频信号的采样分量。因此,这里所用的音频指纹可表示原始音频内容文件的相对低比特率表示。因此,相对于存储从其推导音频指纹的整个音频文件或者该音频文件的部分的成本,存储和访问音频指纹不管怎样都可以是有效率的或者经济的。

一旦生成和存储音频指纹,以后从其生成指纹的对应波形就可通过参照其指纹被识别。可将音频指纹存储在例如数据库中。存储的音频指纹可以比如通过查询存储它们的数据库来访问,以对与存储的音频指纹进行比较的音频采样进行识别、归类或换句话讲分类。因此,声学指纹可用于识别用户正播放的音乐或者其它记录的、流传输的或以其它方式传输的音频媒体,管理声音库,监控广播、网络行为和广告,以及从与视频内容(例如电影)相关联的音频内容(例如声道)识别该视频内容。

声学指纹的可靠性可以与该声学指纹与特定的音频波形可识别地(比如,唯一地)对应的特定性相关。一些音频指纹如此精确地提供识别,以至于可依靠它们来识别相同音乐的不同演奏。而且,由于音频内容被人类心理声学系统感知,所以一些声学指纹基于音频内容。因此,这样的鲁棒的音频指纹使得可在通过基于感知的音频编解码器、甚至涉及有损压缩的编解码器(它因此可能趋向于降低音频内容质量)对音频内容进行压缩、解压缩、码转换和其它改变之后识别该内容。

音频指纹可从被感知编码的音频剪辑、序列、分段、部分等推导得到。因此,即使在通过基于感知的音频编解码器、甚至涉及有损压缩的编解码器(它因此可能趋向于降低音频内容质量,该音频内容质量的降低实际上可能对于检测是感觉不到的)对内容进行压缩、解压缩、码转换和其它改变之后,也可通过将音频序列与其指纹进行比较来精确地识别该音频序列。而且,对于与音频指纹对应的内容的信号质量降低、以及各种攻击或者诸如离速(off-speed)播放的情形,音频指纹可以鲁棒地工作。

音频媒体内容可以在概念上、商业上或者其它方面以某种方式与分开的且截然不同的(distinct)内容实例相关。与音频内容相关的内容可包括,但不限于,其它音频、视频或多媒体内容。例如,某首歌曲可以以某种概念方式与特定电影相关。其它示例可以是在某种商业背景下与给定语音、演讲或音乐片段相关的文本文件或计算机图形。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200980133072.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top