[发明专利]直接显示基音周期轨迹的基音周期谱图方法有效
申请号: | 201810846509.6 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109346105B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 张二华;唐伟;唐振民;王凯龙;张丽娜 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L21/0272;G10L21/0208 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
地址: | 210094 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 直接 显示 基音 周期 轨迹 方法 | ||
1.一种直接显示基音周期轨迹的基音周期谱图方法,其特征在于包括如下步骤:
(1)设置基音周期谱图的参数,包括水平方向与垂直方向的比例尺、帧长、帧移及基音周期谱图的显示范围;
(2)语音信号的预处理,包括预加重、按设置的帧长和帧移进行的语音数据的分帧和利用帧长进行的加窗处理;
(3)利用设置的基音周期谱图显示范围内的每帧语音数据计算每一帧的频谱;
(4)利用每一帧的频谱计算每一帧的倒谱及倒谱的振幅;
(5)将倒谱的振幅值转换为灰度,将各帧倒谱的数据点绘制为像素点,像素点的颜色就是倒谱的灰度;
(6)按设置的水平方向和垂直方向的比例尺绘制基音周期谱图,将各帧倒谱的像素点沿垂直方向并排绘制,横轴为时间,纵轴为倒谱频率,从下往上,倒谱频率逐渐递增;每帧倒谱像素点的水平位置为该帧的中点,沿垂直方向依次绘制该帧倒谱的像素点,使相邻帧的倒谱峰值互相靠近,形成一条基音周期轨迹。
2.如权利要求1所述的基音周期谱图方法,其特征在于:步骤(1)中所述设置帧长的方法为:将基音周期谱图显示范围内的语音数据划分为一系列长度为32ms的帧。
3.如权利要求1所述的基音周期谱图方法,其特征在于:步骤(1)中所述设置帧移的方法为:根据水平方向的比例尺和帧长,使相邻帧的中点间距为1个像素点。
4.如权利要求1所述的基音周期谱图方法,其特征在于:步骤(2)中所述预加重的方法为:
预加重使用一阶数字滤波器来实现,公式为:
H(z)=1-uz-1
式中,u为预加重系数,设置为0.95,语音信号经预加重后表示为:
s(k)=x(k)-ux(k-1)
式中k为语音数据点序号。
5.如权利要求1或4所述的基音周期谱图方法,其特征在于:步骤(2)中所述加窗处理的方法为:
用汉明窗函数w(k)乘以每帧的语音数据s(k),得到加窗处理后的语音数据sw(k)=s(k)×w(k);
汉明窗函数公式为:
其中,N表示帧长。
6.如权利要求1所述的基音周期谱图方法,其特征在于:步骤(3)所述计算每一帧的频谱的方法为:
对设置的基音周期谱图显示范围内的每帧语音数据进行傅里叶变换,得到语音帧的短时频谱,公式为:
其中,Pn(m)表示第n帧的频谱,m为频率采样点序号,N为帧长,sn(k)表示加窗后第n帧的第k个语音数据。
7.如权利要求1所述的基音周期谱图方法,其特征在于:步骤(4)所述计算每一帧的倒谱及倒谱的振幅的方法为:
对每一帧的频谱求模,得到振幅谱,对振幅谱取对数后,再做傅里叶逆变换,得到倒谱;
设第n帧的第m个频率采样点为Pn(m),它是一个复数:
Pn(m)=PRn(m)+iPIn(m)
其中PRn(m)为实部,PIn(m)为虚部,则计算频谱的振幅谱An(m)公式为:
倒谱的计算公式为:
其中,Cn(l)表示第n帧的倒谱,l为倒谱采样点序号,N为帧长;
倒谱也是一个复数,设第n帧的第l个倒谱采样点Cn(l)为:
Cn(l)=CRn(l)+iCIn(l)
其中CRn(l)为倒谱的实部,CIn(l)为倒谱的虚部,则计算倒谱的模,即倒谱的振幅Bn(l)公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810846509.6/1.html,转载请声明来源钻瓜专利网。