[发明专利]声音合成有效
申请号: | 200680004591.3 | 申请日: | 2006-02-01 |
公开(公告)号: | CN101116136A | 公开(公告)日: | 2008-01-30 |
发明(设计)人: | A·J·格里茨;A·W·J·乌门;M·克莱恩米德林克;M·施克泽尔巴 | 申请(专利权)人: | 皇家飞利浦电子股份有限公司 |
主分类号: | G10L19/08 | 分类号: | G10L19/08;G10H7/02;G10H7/10 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 熊延峰;谭祐祥 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 合成 | ||
技术领域
本发明涉及声音的合成。更特别的是,本发明涉及用于使参数集合表示的声音合成的设备和方法,每个参数集合包括表示声音正弦分量的正弦参数以及表示其它分量的其它参数。
背景技术
利用参数集合表示声音是公知的。过去常常利用所谓的参数编码技术来有效地编码由一系列参数表示的声音。合适的解码器能够利用该一系列参数基本上重建原始的声音。该一系列参数可以分成多个集合,每个集合对应于诸如(人类的)扬声器或者乐器之类的单独声音源(声道)。
流行的MIDI(乐器数字接口)协议可以使音乐由乐器的指令集合表示出来。每个指令分配给特定的乐器。每种乐器能够使用一个或多个声道(称作MIDI“音”)。可以同时使用的声道数量称作多音级或者多音。能够有效地发送和/或存储该MIDI指令。
合成器通常使用预先确定的定音数据,例如声音库或者音色数据。在声音库中,存储了作为声音数据的乐器声音样本,而音色数据限定发声器的控制参数。
MIDI指令使该合成器从声音库中检索声音数据,并且合成由这些数据表示的声音。如常规波表合成的情况一样,这些声音数据可以是实际的声音样本,即数字化声音(波形)。然而,声音样本通常需要大的存储空间,在比较小的设备中是不可行的,尤其是在诸如移动(蜂窝)电话之类的手持消费设备中。
可选的是,可以由参数表示声音样本,这些参数可以包括振幅、频率、相位和/或包络线状参数,并且这些参数可以重建声音样本。存储声音样本的参数通常比存储实际的声音样本需要小得多的存储空间。然而,声音合成的计算量繁重。特别是在必须同时(多音)合成表示不同声道(MIDI“音”)的不同参数集合时。计算量通常随着所要合成的声道(音)的数量而线性增加。这使得难以在手持设备中使用这些技术。
2004年5月柏林(德国)音频工程协会会议论文集No.6063,由M.Szczerba、W.Oomen和M.Klein Middelink撰写的论文《基于参数音频编码的波表合成(Parametric Audio Coding Based WavetableSynthesis)》披露了一种SSC(正弦编码)波表合成器。SSC编码器将音频输入分解成瞬态、正弦波和噪声分量,并且针对这些分量中的每个分量生成参数表示。将这些参数表示存储在声音库中。该SSC解码器(合成器)使用该参数表示来重建原始的音频输入。为了重建该正弦分量,该论文提出了将每个正弦波的能量谱收集到信号的谱线图像中,然后利用单一反转傅立叶变换合成该正弦波。这种重建过程的计算量仍然相当大,尤其是在必须同时合成大量声道的正弦波时。
在许多现代声音系统中,能够使用64个声道并且设想更多的声道。这使得已知的配置不再适合于计算能力有限的较小设备中。
另一方面,对于手持消费设备中声音合成的要求越来越高,例如移动电话。如今的消费者希望其手持设备能够产生宽范围的声音,例如不同的铃声。
发明内容
因此,本发明的目的是克服现有技术的这些及其它问题,并且提供一种用于合成声音正弦分量的设备和方法,该设备和方法会更加有效并且减小了计算量。
相应地,本发明提供了一种用于合成包含正弦分量的声音的设备,该设备包括:
-选择装置,利用感知相关值从多个频带的每一个中选择有限数量的正弦分量,以及
-合成装置,仅合成选定的正弦分量。
通过仅合成选定的正弦分量,可以实现计算量的显著减小,同时基本上保持合成后声音的质量。选定并合成的有限数量的正弦分量优选比可获得的数量小的多,例如1600中的110个,但是实际选定的数量通常取决于该设备的计算能力、所希望的声音质量和/或所关心的频带内可获得的正弦成分的数量。
所要进行选择的频带数量还可以变化。优选的是,在所有可获得的频带中进行选择程序,从而实现最大可能的减少。然而,还可以在一个或仅仅少数频带中选择有限数量的正弦分量。该频带的宽度还可以从几赫兹变化到几千赫兹。
该感知相关值优选包括各个正弦成分的振幅和/或能量。任意的感知相关值可以基于心理声学模型,该模型考虑到参数(例如振幅、能量和/或相位)对于人耳的感知相关性。这种心理声学模型本身可以是公知的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦电子股份有限公司,未经皇家飞利浦电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680004591.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提高泡沫陶瓷过滤器常温强度的方法
- 下一篇:侧翻式底板自卸货箱