[发明专利]语音数据处理方法、装置、电子设备及可读存储介质有效
申请号: | 201810049575.0 | 申请日: | 2018-01-18 |
公开(公告)号: | CN108269579B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 卓鹏鹏;张康;方博伟;尤嘉华;张伟 | 申请(专利权)人: | 厦门美图之家科技有限公司 |
主分类号: | G10L21/013 | 分类号: | G10L21/013 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 苏胜 |
地址: | 361008 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 数据处理 方法 装置 电子设备 可读 存储 介质 | ||
1.一种语音数据处理方法,其特征在于,包括:
获取语音数据及目标MIDI音频,所述语音数据包括与所述目标MIDI音频对齐后的语音;
获得所述语音数据的初始频域参数;
获得与预设的目标MIDI音频对应的目标频域参数,其中所述初始频域参数包括所述语音数据的初始相位,所述目标频域参数包括与所述目标MIDI音频对应的目标相位;
根据所述目标频域参数对所述初始频域参数进行修改,将所述语音数据中的音高变换到所述目标MIDI音频中的目标音高,得到变调后的语音数据;
所述根据所述目标频域参数对所述初始频域参数进行修改的步骤,包括:
将所述语音数据中浊音的初始相位替换为对应的目标波形的相位值。
2.根据权利要求1所述的语音数据处理方法,其特征在于,获得语音数据的初始频域参数的步骤包括:
获取所述语音数据中与所述目标音高对应时间上的语音数据;
对与所述目标音高对应时间上的语音数据进行去零点漂移和预加重处理;
对经过去零点漂移和预加重处理的语音数据进行时频转换,得到所述语音数据每一帧的频域参数。
3.根据权利要求2所述的语音数据处理方法,其特征在于,对经过去零点漂移和预加重处理的语音数据进行时频转换的步骤包括:
计算所述语音数据中每一帧的帧移;
根据计算得到的帧移及预设的窗函数对所述语音数据进行分帧、加窗;
将分帧、加窗后的每一帧语音数据进行傅里叶变换,得到所述语音数据中每一帧的频域参数。
4.根据权利要求3所述的语音数据处理方法,其特征在于,计算所述语音数据中每一帧的帧移的步骤包括:
利用采样率除以目标频率得到每一帧的帧移,其中所述目标频率为所述目标MIDI音频的频率,目标频率采用以下公式计算得到:
其中,F为所述目标MIDI音频的目标频率,MIDINote为所述目标MIDI音频包括的音高值。
5.根据权利要求1所述的语音数据处理方法,其特征在于,所述目标MIDI音频记录有声音的目标频率,获得与预设的目标MIDI音频对应的目标频域参数的步骤包括:
生成与所述目标频率相同音高的,且与该目标频率对应的语音数据等时长的目标波形;
提取所述目标波形的相位值,作为所述目标频域参数;
相应的,根据所述目标MIDI音频的频域参数对所述语音数据的频域参数进行修改的步骤包括:
将所述语音数据中与该目标波形对应位置的语音数据的相位值替换为所述目标波形的相位值,得到变调后的语音数据的频域参数;
对变调后的语音数据的频域参数进行逆傅里叶变换,并通过OLA重叠叠加算法处理后得到变调后的语音数据。
6.一种语音数据处理装置,其特征在于,包括:
数据获取模块,用于获取语音数据及目标MIDI音频,所述语音数据包括与所述目标MIDI音频对齐后的语音;
语音数据处理模块,用于获得所述语音数据的初始频域参数;
目标MIDI音频处理模块,获得与预设的目标MIDI音频对应的目标频域参数,其中所述初始频域参数包括所述语音数据的初始相位,所述目标频域参数包括与所述目标MIDI音频对应的目标相位;
变调模块,用于根据所述目标频域参数对所述初始频域参数进行修改,将所述语音数据中的音高变换到所述目标MIDI音频中的目标音高,得到变调后的语音数据;
所述变调模块还用于将所述语音数据中浊音的初始相位替换为对应的目标波形的相位值。
7.根据权利要求6所述的语音数据处理装置,其特征在于,所述语音数据处理模块获得语音数据的初始频域参数的方法包括:
对所述语音数据进行去零点漂移和预加重处理;
对经过去零点漂移和预加重处理的语音数据进行时频转换,得到所述语音数据每一帧的频域参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门美图之家科技有限公司,未经厦门美图之家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810049575.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于处理信息的方法和装置
- 下一篇:回声消除方法及装置