[发明专利]一种确定非噪声音频信号类别的方法及装置有效
申请号: | 200710149984.X | 申请日: | 2007-09-30 |
公开(公告)号: | CN101399039A | 公开(公告)日: | 2009-04-01 |
发明(设计)人: | 王珺;王喆 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L11/02;G10L19/00;G10L19/14 |
代理公司: | 北京挺立专利事务所 | 代理人: | 皋吉甫 |
地址: | 518129广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 噪声 音频 信号 类别 方法 装置 | ||
1.一种确定非噪声音频信号类别的方法,其特征在于,包括以下步骤:
获取非噪声音频信号的特征参数;
根据所述特征参数,利用决策树初步判决所述非噪声音频信号的类别;
根据所述非噪声音频信号的语境和所述初步判决的结果,确定所述非噪声音频信号的类别;
在确定非噪声音频信号的类别之后,还包括:在所述非噪声音频信号进行语音状态和音乐状态的转换之间加入过渡状态;所述过渡状态包括语音到音乐状态和音乐到语音状态,具体包括:
当确定所述非噪声音频信号的类别为语音信号,且所述非噪声音频信号之前的类别为音乐信号时,所述非噪声音频信号由音乐状态进入所述音乐到语音状态;
当所述非噪声音频信号的类别持续确定为语音信号的时间到达预先设置的持续时间门限值时,所述非噪声音频信号由音乐到语音状态进入语音信号状态;
当确定所述非噪声音频信号的类别为音乐信号,且所述非噪声音频信号之前的类别为语音信号时,所述非噪声音频信号由语音状态进入所述语音到音乐状态;
当所述非噪声音频信号的类别持续确定为音乐信号的时间到达预先设置的持续时间门限值时,所述非噪声音频信号由语音到音乐状态进入音乐信号状态;
当确定所述非噪声音频信号的类别为语音信号,且所述非噪声音频信号之前的类别为音乐信号时,当所述非噪声音频信号的类别持续确定为语音信号的时间没有到达预先设置的持续时间门限值时,所述非噪声音频信号由音乐到语音状态进入音乐信号状态;
当确定所述非噪声音频信号的类别为音乐信号,且所述非噪声音频信号之前的类别为语音信号时,当所述非噪声音频信号的类别持续确定为音乐信号的时间没有到达预先设置的持续时间门限值时,所述非噪声音频信号由语音到音乐状态进入语音信号状态。
2.如权利要求1所述确定非噪声音频信号类别的方法,其特征在于,所述特征参数包括如下参数中的至少一个:
归一化帧间谱波动flux;归一化帧间谱波动的方差varflux;归一化帧间谱波动的方差滑动平均varmovflux;归一化频带谱波动fflux;归一化频带谱波动的方差varfflux;归一化频带谱波动的方差滑动平均varmovfflux;归一化子带能量标准差stdave;能量比率ratiol;能量比率的长时平均mov_ratiol;能量比率的方差var_ratiol;时域过零率zcr;谐波结构稳定性特征hss。
3.如权利要求1所述确定非噪声音频信号类别的方法,其特征在于,当所述决策树为多变量决策树时,所述利用决策树初步判决非噪声音频信号的类别,具体包括:利用包括多个特征参数的超平面决策树结点,初步判决所述非噪声音频信号为语音信号或音乐信号。
4.如权利要求1所述确定非噪声音频信号类别的方法,其特征在于,当所述决策树为单变量决策树时,所述利用决策树初步判决非噪声音频信号的类别,具体包括:
利用一个或多个包括一个特征参数及预先设定的与所述特征参数对应的参数门限值的决策树结点,获取当前非噪声音频信号的音乐/语音概率;
根据所述当前非噪声音频信号的音乐/语音概率和预先设定的概率门限值,判定所述当前非噪声音频信号为语音信号、音乐信号或不确定信号;
根据对所述当前非噪声音频信号的判定结果,和相邻连续语音信号帧或相邻连续音乐信号帧的帧数,判定所述当前非噪声音频信号为语音信号或音乐信号。
5.如权利要求4所述确定非噪声音频信号类别的方法,其特征在于,当利用多棵单变量决策树获取当前非噪声音频信号的音乐/语音概率时,在每棵单变量决策树获取到音乐/语音概率之后,还包括:选择所述多棵单变量决策树获取的音乐/语音概率中最大的音乐/语音概率为当前非噪声音频信号的音乐/语音概率。
6.如权利要求5所述确定非噪声音频信号类别的方法,其特征在于,所述多棵单变量决策树包括短时决策树和长时决策树。
7.如权利要求1所述确定非噪声音频信号类别的方法,其特征在于,所述根据非噪声音频信号的语境和初步判决的结果,确定非噪声音频信号的类别,具体包括:
根据拖尾保护值和初步判决的结果,判定所述非噪声音频信号为语音信号或音乐信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710149984.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高显色高色温金卤灯
- 下一篇:一种售票机的发票装置