[发明专利]一种音频信号转视觉颜色信息的方法及系统有效
申请号: | 201410833247.1 | 申请日: | 2014-12-29 |
公开(公告)号: | CN104464741B | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 徐永键;陆许明;刘志敏;谭洪舟 | 申请(专利权)人: | 中山大学花都产业科技研究院;中山大学 |
主分类号: | G10L19/032 | 分类号: | G10L19/032;H04N9/64 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 林丽明 |
地址: | 510800 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 信号 视觉 颜色 信息 方法 系统 | ||
1.一种音频信号转视觉颜色信息的方法,其特征在于,包括以下步骤:
S1:对音频信号进行采样;
S2:计算音频信号的亮度V;
S3:计算音频信号的色相H和饱和度S;
S4:将亮度V、色相H和饱和度S进行RGB颜色格式转换;
S5:将S4中得到的RGB值进行颜色混合最终提取音频信号的颜色值;
其中,音频信号包括模拟音频信号和数字音频信号;
对模拟音频信号进行采样的过程如下:
在单位时间T内采样N个点为一帧信号,N=2M,M为正整数;
对数字音频信号进行采样的过程如下:
对数字音频信号进行重采样,根据音频的采样率与重采样的频率选择增采样或减采样倍数,获取单位时间T内N个点为一帧的采样信号,N=2M,M为正整数;
音频信号的亮度V的过程如下:
单位时间T内的音频信号的平均能量:
其中,u(n)是采样的一帧N点信号;
设音频信号的最大能量为Emax,一帧采样信号对应的亮度V:
;
对采样后的音频信号进行实时FFT得到一帧音频信号的音频频谱,令一帧音频频谱中第i个采样点的频率为fi,该采样点的色相Hi为:
令一帧音频频谱中幅度F的最大值是Fmax,最小值是Fmin,一帧音频频谱中第i个采样点的颜色饱和度Si与幅度Fi的关系为:
。
2.根据权利要求1所述的音频信号转视觉颜色信息的方法,其特征在于,所述步骤S4的过程如下:
一帧音频频谱中第i个采样点的颜色向量 (Ri,Gi,Bi)为:
。
3.根据权利要求2所述的音频信号转视觉颜色信息的方法,其特征在于,所述步骤S5的过程如下:
一帧音频频谱中N个采样点的RGB的平均值为:
。
4.一种实现如权利要求1-3任一项所述的音频信号转视觉颜色信息方法的系统,其特征在于,包括:
信号采样模块,用于采集模拟音频信号或数字音频信号;
亮度值计算模块,用于计算采集到的音频信号的亮度值V;
色相和饱和度计算模块,用于计算采集到的音频信号的色相H和饱和度S;
HSV转RGB模块,用于将亮度V、色相H和饱和度S进行RGB颜色格式转换;
RGB颜色混合模块,用于将HSV转RGB模块中得到的得到的RGB值进行颜色混合最终提取音频信号的颜色值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学花都产业科技研究院;中山大学,未经中山大学花都产业科技研究院;中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410833247.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:发音韵律问题的检测方法及装置
- 下一篇:一种语音播报系统和方法