[发明专利]一种用于语音可视化的语谱图彩色增强方法无效
申请号: | 200910235643.3 | 申请日: | 2009-10-10 |
公开(公告)号: | CN102044254A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 赵胜辉;董欣玮;王晶;匡镜明 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G10L21/06 | 分类号: | G10L21/06 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 张利萍;高燕燕 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明为一种用于语音可视化的语谱图彩色增强方法,包括对原始语音信号分帧、加窗,提取每帧信号在各个特征频带内的短时能量值;将语音信号的有效频带平均分为N个特征频带,分别计算每帧语音信号在N个特征频带内的能量值;以各个特征频带内的能量值为参数对相应特征频带预先设定的色彩饱和度进行修正;对N个频带内的能量值进行归一化处理;利用归一化后的能量值对N特征频带既定色彩的饱和度进行修正;将语音信号N个特征频带的修正后的色相、饱和度、亮度利用色彩学转换公式转化为RGB三原色值;绘制直方图。本发明语音信号色彩生成模块,通过不同色彩反映语音信号频谱的能量集中区域,易于辨识;动态反映出发音的帧间变化,符合发音规律。 | ||
搜索关键词: | 一种 用于 语音 可视化 语谱图 彩色 增强 方法 | ||
【主权项】:
一种用于语音可视化的语谱图彩色增强方法,其特征在于:包括以下步骤:第一步:对原始语音信号分帧、加窗,提取每帧信号在各个特征频带内的短时能量值;第二步:将语音信号的有效频带平均分为N个特征频带,分别计算每帧语音信号在N个特征频带内的能量值; E m = Σ n = m m + N - 1 s w 2 ( n ) - - - ( 1 ) 其中,m是窗的起点,N是窗长(点数);第三步:以各个特征频带内的能量值为参数对相应特征频带预先设定的色彩饱和度进行修正;对N个频带内的能量值进行归一化处理;第四步:利用归一化后的能量值对N特征频带既定色彩的饱和度进行修正;第五步:将语音信号N个特征频带的修正后的色相、饱和度、亮度利用色彩学转换公式转化为RGB三原色值;第六步:绘制直方图,横轴为时间轴,以帧为单位,纵轴为1‑N,表示相应的N个特征频带,对每帧的N个特征频带进行着色,其色彩为修正饱和度之后所对应的RGB配色。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910235643.3/,转载请声明来源钻瓜专利网。