[发明专利]音乐/非音乐的实时检测方法和装置有效
申请号: | 200810083110.3 | 申请日: | 2008-03-03 |
公开(公告)号: | CN101236742A | 公开(公告)日: | 2008-08-06 |
发明(设计)人: | 刘开文;付中华 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L19/00 |
代理公司: | 北京康信知识产权代理有限责任公司 | 代理人: | 尚志峰;吴孟秋 |
地址: | 518057广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音乐 实时 检测 方法 装置 | ||
技术领域
本发明涉及通信领域,具体而言,涉及一种音乐/非音乐的实时检测方法和装置。
背景技术
在语音通信领域中,常常因为传输带宽的约束需要进行非连续传输(Discontinued Transmission,DTX),其中最关键的步骤就是语音活动检测(Voice Activity Detection,VAD)。随着多媒体业务的不断丰富,通信中除了语音和环境声学噪声之外,常常有彩铃等音乐信号加入,而在DTX传输条件下,一般的VAD会把部分音乐信号当作噪声进行处理,使得音乐信号无法正常传输,并且音乐信号的编码方式也有别于非音乐(包括噪声、语音、和静音等),因此必须及时检测出这些音乐信号,进而采用合适的编码算法进行传输。另外,噪声抑制(Noise Reduction,NR)中,如果音乐信号也采用非音乐的方式进行处理,会使音乐信号严重失真,因此也有必要做音乐/非音乐的判断。
在音频通信应用中,音乐/非音乐的检测难度在于音乐的多变以及语音中的噪声的多变。许多研究内容都分析了音乐与语音的差异,但因为音乐的多变使得这些差异只对部分音乐有效。通常语音的静默片断出现的概率大、能量变化大,但在节奏很快的音乐中也有类似现象;许多音乐的高频信息丰富,但在歌唱时也并非如此;音乐的基音频率要么变化小、要么突变,但和声和复调音乐使基音频率的提取有时非常困难;音乐有节奏感,但却并非简单的周期重复。使问题更为棘手的是语音中包含的噪声,尤其是谐波噪声,这些谐波噪声在较短的时间内与乐声很像,只是因为持续时间长才成为噪声。
目前的音乐/非音乐分类方案主要存在以下不足:(1)从音频信号短时处理出发提取的短时特征仅仅利用了很少量的信息,不足以反映两类信号的差异。实际上在较短的时间内看,音乐、语音和噪声常常没有明显的界限;(2)长时分析缺乏有力的特征描述,要么时间片要求较长,例如对整个音频文件的分类,不适于实时通信领域的要求,要么是从音频动态特征衍生出来新的统计特征,但其分类能力却无法保证;(3)常常需要获得音乐和语音及噪声的精细结构及其变化,对采样率和计算量要求较高,难以满足在嵌入式平台上应用;(4)所用的测试数据不充分,很难满足复杂的通信环境的要求。
在实现本发明过程中,发明人发现总之,实际应用对音乐/非音乐检测的要求是实时、稳健性、有效,能够为后续处理奠定基础,而目前的问题是——短时分析有用信息太少,难以反映两者的差异;长时分析可以较好地反映两者差异,但是计算量大,延时长;特征不够稳健,对音乐和语音及噪声内在的区别没有充分的反映。
发明内容
本发明旨在提供一种音乐/非音乐的实时检测方法和装置,能够解决现有的短时分析和长时分析上述各自存在的问题。
在本发明的实施例中,提供了一种音乐/非音乐的实时检测方法,包括以下步骤:对信号进行预处理;计算预处理过的信号的短时特征;达到一个分析步长之后,计算累计短时能量均方根,以判定信号是否为静默状态;如果确定为非静默状态,则根据短时分析参数计算长时特征参数;根据计算的长时特征参数进行统计分类,根据混合高斯模型确定当前分析区间内的声音类别是音乐/非音乐;以及对信号进行后处理,以消除突变状态。
优选的,对信号进行预处理具体包括:入口参数控制、模型库加载、输入文件或数据格式处理,以及预加重、分帧加窗、参数和缓冲区初始化。
优选的,入口参数控制包括设置语音信号或噪声信号检测得分的额外加分spS和nsS;模型库加载包括加载事先经过大量数据训练过的语音、噪音、音乐三者的统计模型,静音是以短时能量判断;输入文件或数据格式处理采用8kHz采样16比特量化;预加重系数取系数为-0.80;分帧加窗取帧长为32毫秒,256个采样点;参数和缓冲区初始化为帧移10毫秒,80个采样点,窗函数采用256点的海明窗。
优选的,计算预处理过的信号的短时特征具体包括:计算时域短时能量特征、幅度谱以及频谱特征、实倒谱、谱起伏程度参数、Mel域子带能量以及短时调性强度特征,并标记当前帧的调性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810083110.3/2.html,转载请声明来源钻瓜专利网。