[发明专利]基于共振峰频率的汉语普通话单韵母语音可视化方法无效
申请号: | 200910235647.1 | 申请日: | 2009-10-10 |
公开(公告)号: | CN102176313A | 公开(公告)日: | 2011-09-07 |
发明(设计)人: | 赵胜辉;董欣玮;王晶;匡镜明 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G10L21/06 | 分类号: | G10L21/06 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 张利萍;高燕燕 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明为一种基于共振峰频率的汉语普通话单韵母语音可视化方法,包括对原始语音信号分帧、加窗,提取每帧信号的短时能量、共振峰频率、基音频率,采用中值平滑方法纠正共振峰频率、基音频率个别数值的错误;利用共振峰频率将不同发音映射为不同色彩方面并修正:在图像上反应发音时间、能量、音调基音频率的变化趋势,利用色彩来区分不同汉语普通话单韵母发音。本发明只提取语音信号的短时能量、共振峰频率、基音频率几个简单的语音声学参数,易于实现;引入软判决,对于每个发音不做硬性判决,而是采用不同色彩表示,不同发音人同一个音的可视化效果求大同而存小异,这使得对于发音的判决更符合人的主观感知。 | ||
搜索关键词: | 基于 共振 频率 汉语 普通话 韵母 语音 可视化 方法 | ||
【主权项】:
基于共振峰频率的汉语普通话单韵母语音可视化方法,其特征在于:包括以下步骤:第一步:对原始语音信号分帧、加窗,提取每帧信号的短时能量、共振峰频率、基音频率;第二步:采用中值平滑方法纠正共振峰频率、基音频率个别数值的错误;第三步:利用共振峰频率将不同发音映射为不同色彩方面,采用以下公式: R = 0.9 * ( 0.0006 * 3 10 * F 1 F 2 + 0.002 * 5 F 3 F 2 ) G = 0.02 * 3 F 3 F 2 + 0.0003 * 80 F 3 - F 1 2000 - - - ( 6 ) B = 0.0012 * 50 F 3 - F 1 2000 其中,F1、F2、F3分别为每帧语音信号的前三个共振峰频率;第四步:对第三步所求出的RGB进行如下修正: r = R , R ≤ 1 1 , R > 1 g = G , G ≤ 1 1 , G > 1 - - - ( 7 ) b = B , B ≤ 1 1 , B > 1 第五步:在图像上反应发音时间、能量、音调基音频率的变化趋势,利用色彩来区分不同汉语普通话单韵母发音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910235647.1/,转载请声明来源钻瓜专利网。