[发明专利]一种用于语音可视化的语谱图彩色增强方法无效
申请号: | 200910235643.3 | 申请日: | 2009-10-10 |
公开(公告)号: | CN102044254A | 公开(公告)日: | 2011-05-04 |
发明(设计)人: | 赵胜辉;董欣玮;王晶;匡镜明 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G10L21/06 | 分类号: | G10L21/06 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 张利萍;高燕燕 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语音 可视化 语谱图 彩色 增强 方法 | ||
1.一种用于语音可视化的语谱图彩色增强方法,其特征在于:包括以下步骤:
第一步:对原始语音信号分帧、加窗,提取每帧信号在各个特征频带内的短时能量值;
第二步:将语音信号的有效频带平均分为N个特征频带,分别计算每帧语音信号在N个特征频带内的能量值;
其中,m是窗的起点,N是窗长(点数);
第三步:以各个特征频带内的能量值为参数对相应特征频带预先设定的色彩饱和度进行修正;对N个频带内的能量值进行归一化处理;
第四步:利用归一化后的能量值对N特征频带既定色彩的饱和度进行修正;
第五步:将语音信号N个特征频带的修正后的色相、饱和度、亮度利用色彩学转换公式转化为RGB三原色值;
第六步:绘制直方图,横轴为时间轴,以帧为单位,纵轴为1-N,表示相应的N个特征频带,对每帧的N个特征频带进行着色,其色彩为修正饱和度之后所对应的RGB配色。
2.根据权利要求1所述的一种用于语音可视化的语谱图彩色增强方法,其特征在于:上述第三步中归一化处理时利用的最大值为第2-第N个频带的能量最大值Em,如果第1个能带的能量大于Em,则直接将其归一化后的数值直接置1,即:
Em=max(E2:E12) (2)
3.根据权利要求1或2所述的一种用于语音可视化的语谱图彩色增强方法,其特征在于:上述第四步中修正的方法为将色彩饱和度的最大乘以相应频带归一化后的能量值Ei′,其中i=1-N;修正后,能量越小的频带色彩饱和度越低。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910235643.3/1.html,转载请声明来源钻瓜专利网。