[发明专利]基于共振峰频率的汉语普通话单韵母语音可视化方法无效

申请号：	200910235647.1	申请日：	2009-10-10
公开（公告）号：	CN102176313A	公开（公告）日：	2011-09-07
发明（设计）人：	赵胜辉;董欣玮;王晶;匡镜明	申请（专利权）人：	北京理工大学
主分类号：	G10L21/06	分类号：	G10L21/06
代理公司：	北京理工大学专利中心 11120	代理人：	张利萍;高燕燕
地址：	100081 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明为一种基于共振峰频率的汉语普通话单韵母语音可视化方法，包括对原始语音信号分帧、加窗，提取每帧信号的短时能量、共振峰频率、基音频率，采用中值平滑方法纠正共振峰频率、基音频率个别数值的错误；利用共振峰频率将不同发音映射为不同色彩方面并修正：在图像上反应发音时间、能量、音调基音频率的变化趋势，利用色彩来区分不同汉语普通话单韵母发音。本发明只提取语音信号的短时能量、共振峰频率、基音频率几个简单的语音声学参数，易于实现；引入软判决，对于每个发音不做硬性判决，而是采用不同色彩表示，不同发音人同一个音的可视化效果求大同而存小异，这使得对于发音的判决更符合人的主观感知。
搜索关键词：	基于共振频率汉语普通话韵母语音可视化方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

基于共振峰频率的汉语普通话单韵母语音可视化方法，其特征在于：包括以下步骤：第一步：对原始语音信号分帧、加窗，提取每帧信号的短时能量、共振峰频率、基音频率；第二步：采用中值平滑方法纠正共振峰频率、基音频率个别数值的错误；第三步：利用共振峰频率将不同发音映射为不同色彩方面，采用以下公式： R = 0.9 * ( 0.0006 * 3 10 * F 1 F 2 + 0.002 * 5 F 3 F 2 ) G = 0.02 * 3 F 3 F 2 + 0.0003 * 80 F 3 - F 1 2000 - - - ( 6 ) B = 0.0012 * 50 F 3 - F 1 2000 其中，F1、F2、F3分别为每帧语音信号的前三个共振峰频率；第四步：对第三步所求出的RGB进行如下修正： r = R , R ≤ 1 1 , R > 1 g = G , G ≤ 1 1 , G > 1 - - - ( 7 ) b = B , B ≤ 1 1 , B > 1 第五步：在图像上反应发音时间、能量、音调基音频率的变化趋势，利用色彩来区分不同汉语普通话单韵母发音。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京理工大学，未经北京理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200910235647.1/，转载请声明来源钻瓜专利网。

上一篇：用于在主要尺寸的数据空间中导航的控制系统
下一篇：基于鱼眼镜头的车载移动摄影测量系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于共振峰频率的汉语普通话单韵母语音可视化方法无效

专利文献下载