[发明专利]使用预设音频场景的基于对象的三维音频服务系统有效
申请号: | 200780023084.9 | 申请日: | 2007-05-16 |
公开(公告)号: | CN101473645A | 公开(公告)日: | 2009-07-01 |
发明(设计)人: | 李用主;李泰辰;刘载铉;姜京玉;洪镇佑;张仁瑄;徐廷一;张大永 | 申请(专利权)人: | 韩国电子通信研究院 |
主分类号: | H04N7/00 | 分类号: | H04N7/00 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 李芳华 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 预设 音频 场景 基于 对象 三维 服务 系统 | ||
技术领域
本发明涉及一种使用预设音频场景(preset audio scene)的基于对象的三维(3-D)音频服务系统及其方法;且更具体地,涉及一种用于提供交互式(interactive)服务的使用预设音频场景的基于对象的3维音频服务系统及其方法,所述交互式服务使用用于向用户或观众提供逼真(realistic)广播的3-D音频相关技术来使得用户或观众能够直接形成音频场景。
背景技术
图1是图示了传统的音频服务系统的视图。
如图1所示,传统的音频服务系统包括:音频服务提供设备10和音频服务再现设备20。音频服务提供设备10包括:音频捕捉单元11,用于捕捉诸如声音之类的音频信号;编辑/混合单元12,用于编辑并混合所捕捉的音频信号、以便将所述音频信号传送至音频服务再现设备20;和存储/传送单元13,用于存储混合后的音频信号、并且将混合后的音频信号传送至音频服务再现设备20。
音频服务再现设备20包括:接收机21,用于接收从音频服务提供设备10传送的音频信号;控制器22,用于控制所接收到的音频信号;和再现器23,用于再现音频信号。
基于传统的音频服务系统通过诸如TV广播、无线电广播、和数字多媒体广播(DMB)之类的广播服务提供的音频信号通常是通过混合从各种声源捕捉的多个音频信号来创建的。例如,通过混合足球场中的喧闹声(noise)、人群的叫喊声(yelling)、和解说员的语音(voice)来创建通过足球比赛广播提供的音频信号。
尽管用户或观众可以控制整个音频信号的音量,但是不可能控制每个对象(例如,解说员的语音、人群的叫喊声、和足球场的喧闹声)的音量。这是因为在一般的广播服务中音频信号是在多个对象音频信号被混合成一个音频信号之后传送的。
然而,如果诸如音频服务提供设备10之类的发射机在声源的对象音频信号没有被混合成一个音频信号的情况下、独立地传送声源的对象音频信号,则诸如音频服务再现设备20之类的接收机可以独立地控制所述声源的对象音频信号的音量。基于对象的音频服务表示下列这种音频服务:其通过经由发射机独立地传送声源的对象音频信号来允许用户或观众在接收机处控制每个对象音频信号。
例如,如果足球比赛广播的音频信号是在基于对象的3-D音频服务的基础上提供的,则用户或观众可以控制每个对象(例如,足球场中的喧闹声、人群的叫喊声、和解说员的语音),以便获得所期望的音频设置。也就是说,用户或观众可以控制使得足球场的喧闹声响亮、使得人群的叫喊声柔和、和使得解说员的语音响亮。或者,观众可以控制音频信号以仅再现足球场的喧闹声和解说员的语音,而没有人群的叫喊声。
因此,非常需要开发一种用于提供基于对象的3-D音频服务的方法,使得用户能够控制声源的每个对象音频信号,所述方法可应用于提供诸如数字广播、无线电广播、数字多媒体广播、因特网广播、数字电影、DVD、运动画面内容之类的音频的所有广播服务和多媒体服务。
尽管在于2004年5月7日公布的韩国专利公开第10-2004-0037437号中介绍了一种传统的基于对象的3-D音频系统及其控制方法,但是该传统的基于对象的3-D音频系统要求用户控制声源的每个对象音频信号以便根据用户的喜好来设置音频信号。因此,这对于用户或观众非常麻烦。
发明内容
技术问题
本发明的实施例致力于提供一种基于对象的三维(3-D)音频服务系统及其方法,所述系统和方法用于通过消除要求用户控制声源的每个对象音频信号的不便,使得用户能够容易且方便地观看和收听基于对象的3-D音频服务。
本发明的其他对象和优点可以通过下列描述来理解,并且可以参考本发明的实施例而变得明显。而且,对于本发明技术领域的技术人员来说显而易见的是,本发明的对象和优点可以通过如权利要求所述的部件及其组合来实现。
技术方案
根据本发明的一方面,提供了一种使用预设音频场景的基于对象的三维(3-D)音频服务提供设备,包括:音频输入部件,用于输入音频信号;预设音频场景生成部件,用于从通过所述音频输入部件输入的音频信号中提取对象音频信号,并且通过在3-D空间中排列所提取的对象音频信号和编辑每个对象的特征,来生成多于一个的3-D音频场景信息;以及编码部件,用于编码和多路复用所述音频信号和用于每个对象音频信号的所述3-D音频场景信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩国电子通信研究院,未经韩国电子通信研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780023084.9/2.html,转载请声明来源钻瓜专利网。