[发明专利]相位对重构语音声调感知影响方法及在人工耳蜗中应用有效
申请号: | 201510066246.3 | 申请日: | 2015-02-09 |
公开(公告)号: | CN104616659B | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 田岚;郭翠翠;魏莹 | 申请(专利权)人: | 山东大学 |
主分类号: | G10L19/12 | 分类号: | G10L19/12 |
代理公司: | 济南圣达知识产权代理有限公司37221 | 代理人: | 赵妍 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了相位对重构语音声调感知影响方法及在人工耳蜗中应用,采用傅立叶变换分析方法,首先对原始语音信号作频域分解,通过改变信号相位谱特征,重构合成新的语音,进而测听重构音的声调感知。实验发现,采用常用窗长分析和重构时,在信号幅频特征不变、初始相位全部置零条件下,得到的重构音节音质会下降,表明相位特征对声调感知是有影响的,且与信号重构窗长有关。进一步采用声音嵌合重构方法,即用来自不同调型音节的幅频特征与相位特征交叉嵌合、重构音节,测听嵌合重构音的声调感知,由此验证调型的感知主要取决于相位特征。 | ||
搜索关键词: | 相位 语音 声调 感知 影响 方法 人工 耳蜗 应用 | ||
【主权项】:
一种相位对重构语音声调感知影响方法,其特征在于,包括以下步骤:步骤1获取原始的汉语语音声调信号;步骤2对步骤1的声调信号采用傅里叶变换分解,得到与汉语语音声调信号相应的幅度、频率和相位三组特征参数;步骤3在相同条件下,保持信号的频率和幅度特征两者同时不变,去掉原始汉语语音声调信号的原相位特征,保持原信号频率和幅度特征不变,重构新信号;具体如下:3‑1.选用符合短时平稳要求的窗长;3‑2.确定帧长、采样率和FFT样点数,随信号推移逐帧作FFT,半帧重叠,得到每帧语音信号频谱X(n,w)如下:X(n,w)=|X(n,w)|ejφ(n,w),n=0,1,...N‑1 (1)|X(n,w)|为短时幅度谱,φ(n,w)=∠X(n,w)为短时相位谱;3‑3保持原语音信号的短时幅度谱|X(n,w)|不变,将短时相位谱φ(n,w)置零,然后将幅度谱|X(n,w)|和零相位谱两者重新组合重构声音;所述的窗长与相位特征关系的确定方法是对同一个音节分别以不同窗长的语音短段进行短时频谱分析和零相位重构;步骤4对重构信号进行识别,进而得到相位特征对重构汉语语音声调感知影响。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510066246.3/,转载请声明来源钻瓜专利网。