[发明专利]使用共振峰增强提取话音共振峰轨迹的方法无效
申请号: | 200710023479.0 | 申请日: | 2007-06-05 |
公开(公告)号: | CN101067929A | 公开(公告)日: | 2007-11-07 |
发明(设计)人: | 王宏;潘金贵 | 申请(专利权)人: | 南京大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L19/04;G10L19/00 |
代理公司: | 南京天翼专利代理有限责任公司 | 代理人: | 汤志武;王鹏翔 |
地址: | 210093*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 共振 增强 提取 话音 轨迹 方法 | ||
1.使用共振峰增强提取话音共振峰轨迹的方法,其特征是首先建立话音的共振峰增强的话音声管模型;设定共振峰增强系数;获得共振峰增强谱;然后直接利用线性预测分析得到共振峰增强谱,用二次搜索算法从共振峰增强谱中提取出分析帧的共振峰频率,同时记录下第一、第二、第三、第四和第五共振峰的频率;最后输出分析帧的共振峰序列就是语音信号的共振峰轨迹;处理步骤是:开始;(1)语音信号输入、(2)预加重、(3)帧移、(4)判断信号结束?是则进入(15)取出共振峰序列,否则进行(5);(5)分帧加窗;(6)计算帧能量;(7)计算帧过零Z并进行判断;(8)利用帧能量门限和过零率门限判断帧的类别,Z>ZTh;E<ETh是否成立;是则进入(9),否则进入(3);(9)标记为清辅音并进入帧移输入端;(10)设定共振峰增强系数;设定线性预测阶数;(11)获得共振峰增强后的线性预测系数;(12)获得共振峰的增强谱;(13)搜索谱的极大值;(14)记录该帧的共振峰频率;(15)取出共振峰序列并结束;
ZTh为帧过零的阈值,取值范围为10~100;E为帧能量,ETh为帧能量阈值,取值范围为0.2~20;
采用的共振峰增强的话音声管模型:其系统函数V(z)的定义如下;其中,G为系统增益;μm(m=1,2,...,M-1)是声管的能量反射系数,z=e2πf,f是频率:
在共振峰增强的全极点模型中设置合适的共振峰增强系数,得到对应的线性预测模型,线性预测模型用Levinson-Durbin递推算法求解;
(6)if i<P goto (1)
其中,为LPC预测输出的N点序列{xi}的自相关函数的估计量,其表达式如下:
算法开始时,a0=1,逐步递推出直到使用提取的共振峰轨迹作为话音识别的特证向量,使用提取的共振峰轨迹作为说话人识别的特证向量;提取的共振峰轨迹用于共振峰声码器;
且用如下数字滤波器对语音信号进行预加重:
H(z)=1-0.95z-1 (3)
相互重叠的语音分析帧,帧长在10ms~40ms之间,帧移在5ms~20ms之间;接收话音信号,以预加重滤波器处理所接收的话音信号;以步长移动获得分析帧;对分析帧进行时域加窗处理;话音分析帧的窗函数是汉明窗或矩形窗;
分析帧的能量E用下式计算:其中,x(n)是分析帧内的语音信号,N是帧的长度,N为正整数
分析帧的过零率Z用式(5)计算:其中,x(n)是分析帧内的语音信号,N是帧的长度,N为正整数;sgn[*]是符号函数由式(6)表示:
其中,δ是过零率门限参数,取值范围在0.01~0.1之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710023479.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可调PVA胶棉的拖把
- 下一篇:电动车双电机框式组合驱动装置