[发明专利]一种用于语音可视化的语谱图彩色增强方法无效

专利信息
申请号: 200910235643.3 申请日: 2009-10-10
公开(公告)号: CN102044254A 公开(公告)日: 2011-05-04
发明(设计)人: 赵胜辉;董欣玮;王晶;匡镜明 申请(专利权)人: 北京理工大学
主分类号: G10L21/06 分类号: G10L21/06
代理公司: 北京理工大学专利中心 11120 代理人: 张利萍;高燕燕
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明为一种用于语音可视化的语谱图彩色增强方法,包括对原始语音信号分帧、加窗,提取每帧信号在各个特征频带内的短时能量值;将语音信号的有效频带平均分为N个特征频带,分别计算每帧语音信号在N个特征频带内的能量值;以各个特征频带内的能量值为参数对相应特征频带预先设定的色彩饱和度进行修正;对N个频带内的能量值进行归一化处理;利用归一化后的能量值对N特征频带既定色彩的饱和度进行修正;将语音信号N个特征频带的修正后的色相、饱和度、亮度利用色彩学转换公式转化为RGB三原色值;绘制直方图。本发明语音信号色彩生成模块,通过不同色彩反映语音信号频谱的能量集中区域,易于辨识;动态反映出发音的帧间变化,符合发音规律。
搜索关键词: 一种 用于 语音 可视化 语谱图 彩色 增强 方法
【主权项】:
一种用于语音可视化的语谱图彩色增强方法,其特征在于:包括以下步骤:第一步:对原始语音信号分帧、加窗,提取每帧信号在各个特征频带内的短时能量值;第二步:将语音信号的有效频带平均分为N个特征频带,分别计算每帧语音信号在N个特征频带内的能量值; E m = Σ n = m m + N - 1 s w 2 ( n ) - - - ( 1 ) 其中,m是窗的起点,N是窗长(点数);第三步:以各个特征频带内的能量值为参数对相应特征频带预先设定的色彩饱和度进行修正;对N个频带内的能量值进行归一化处理;第四步:利用归一化后的能量值对N特征频带既定色彩的饱和度进行修正;第五步:将语音信号N个特征频带的修正后的色相、饱和度、亮度利用色彩学转换公式转化为RGB三原色值;第六步:绘制直方图,横轴为时间轴,以帧为单位,纵轴为1‑N,表示相应的N个特征频带,对每帧的N个特征频带进行着色,其色彩为修正饱和度之后所对应的RGB配色。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200910235643.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top