[发明专利]基于分数阶傅里叶变换的语音非语音检测方法有效

申请号：	201310557124.5	申请日：	2013-11-11
公开（公告）号：	CN103578466A	公开（公告）日：	2014-02-12
发明（设计）人：	张卫强;刘加	申请（专利权）人：	清华大学
主分类号：	G10L15/04	分类号：	G10L15/04
代理公司：	北京众合诚成知识产权代理有限公司 11246	代理人：	陈波
地址：	100084 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于分数傅里叶变换语音检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于分数阶傅里叶变换的语音非语音检测方法，其特征在于，所述方法具体包括以下步骤：

步骤1：对音频信号按帧长25ms，帧移10ms进行分帧处理；

步骤2：对分帧处理后的每帧信号进行零均值化和加窗处理；

步骤3：在步骤2的基础上，对每帧信号进行不同阶次的分数阶傅里叶变换，得到不同阶次的分数阶频谱；

步骤4：对每一阶次的分数阶频谱，计算其分数阶频谱熵；

步骤5：对不同阶次的分数阶频谱熵取最大值，并将最大值与设定的阈值进行比较，如果大于阈值，则判决为非语音；否则，判决为语音。

2.根据权利要求1所述的方法，其特征在于，所述加窗处理指的是对分帧处理后的每帧信号加汉明窗或汉宁窗。

3.根据权利要求1所述的方法，其特征在于，所述不同阶次的设定为：阶次从0到1，每隔0.05进行一次。

4.根据权利要求1所述的方法，其特征在于，所述对每帧信号进行不同阶次的分数阶傅里叶变换的公式为：

Xp(u)=∫-∞+∞Kp(u,t)x(t)dt]]>

其中，x(t)是加窗后的信号，X_p(u)是信号p阶傅里叶变换，K_p(u,t)是p阶傅里叶变换的核函数，其定义为Kp(u,t)=Aαejπ{t2cotα-2utcscα+u2cotα},α≠nπδ(t-u),α=2nπδ(t+u),α=2nπ±π,]]>n为整数，是归一化系数，α=pπ/2；p为变换的阶次。