[发明专利]一种基于音频突发事件分类的多码本编码参数量化方法有效
申请号: | 200910088368.7 | 申请日: | 2009-07-02 |
公开(公告)号: | CN101587710A | 公开(公告)日: | 2009-11-25 |
发明(设计)人: | 王晶;谢湘;匡镜明 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L11/00;G10L15/08 |
代理公司: | 北京理工大学专利中心 | 代理人: | 张利萍 |
地址: | 100081北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 音频 突发事件 分类 编码 参数 量化 方法 | ||
1.一种基于音频突发事件分类的多码本编码参数量化方法,其特征在于包 括以下步骤:
步骤一、对输入的音频信号逐帧进行暂态检测:
首先,计算短时帧与长时帧的能量比:对输入的每帧音频信号的采样点x1、 x2、......、xN,用窗长为L个样点的矩形滑动窗将长时帧划分为交叠长度为p 个样点的短时帧,短时帧间呈50%叠接;
然后,分别计算长时帧的总能量和每个短时帧的能量
之后,进行门限判决:计算本帧内每个短时帧能量和长时帧总能量之比, 若某一能量比超过了预设的门限值Rthr,即Eshort(k)/Elong>Rthr,则判别该长时 帧为暂态帧,否则,判别其为非暂态帧;
步骤二、对由步骤一检测出的暂态帧采用基于GMM的模式识别方法进行 突发事件分类:若从暂态帧中提取的PLP感知加权线性预测特征和事先已通过 训练得到的某一类音频突发事件的GMM参考模型的匹配似然度最大,则判别 该暂态帧所属的音频信号为此类音频突发事件;
步骤三、对音频突发事件的编码参数,进行基于突发事件分类码本的矢量 量化:
事先对每类音频突发事件的编码参数进行LBG码本训练,得到每类事件对 应的参数码本,针对每一类特定音频突发事件的训练语料,对所有输入分析帧 进行MDCT变换编码得到待量化的MDCT谱系数矢量,利用LBG码本训练算 法得到每一类突发事件对应的谱系数码本,从而为每类音频突发事件建立了矢 量量化码本,形成多码本库;
然后根据经步骤二判别出的音频突发事件,在每类已经训练好的谱系数编 码参数码本库中,选择相对应的该类码本进行矢量量化,输出参数矢量的码字 索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910088368.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:活动笔架
- 下一篇:一种环保耐用玻璃书写板