[发明专利]一种基于微分声门波模型的语音变调变嗓音方法有效
申请号: | 201810083797.4 | 申请日: | 2018-01-29 |
公开(公告)号: | CN108281150B | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 周林灿;申炎仃;黄昭鸣;孙海霞 | 申请(专利权)人: | 上海泰亿格康复医疗科技股份有限公司 |
主分类号: | G10L19/04 | 分类号: | G10L19/04;G10L19/087;G10L19/18;G10L19/26;G10L21/013;G10L25/45 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 200438 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 微分 声门 模型 语音 变调 嗓音 方法 | ||
本发明公开了一种基于微分声门波模型的语音变调变嗓音方法,本发明采用线性预测编码技术和微分声门波相结合的方法合成变调语音,将语音信号通过LPC逆滤波器得到的残差信号即为声门信号的一阶差分,用LF模型对其进行更细致的模拟得到高质量的声门激励信号,从而合成高质量的变调语音。本发明简单、有效、快速,通过te/tc和tp/tc能灵活控制嗓音源,具有广泛的实用价值。
技术领域
本发明属于语音合成技术领域,涉及一种语音变调方法,尤其是涉及一种基于微分声门波模型的语音变调、变嗓音方法。
背景技术
随着信息技术的发展,传统的音视频素材已无法满足人们的需求,融合语言学、信号处理技术、计算机科学等多领域的语音合成技术应运而生。其中的语音变调不变速技术具有广阔的应用市场,如保护说话人隐私,提供某种娱乐效果,帮助语言功能不完善或受损的患者进行语音恢复,用作如语音邮件、广播电台变声热线、多媒体音效处理、军事保密通信等,可广泛应用于民用,商用,医用和军用等多个领域。
语音变调不变速指改变语音基音频率的大小,同时保持语速和语义不变,即保持短时频谱包络和时间过程基本不变。语音变调不变速算法中,基于线性预测的方法具有简单、完全自动的分析步骤,合成器结构简单,硬件实现容易等优点,但嗓音源序列采用简单的脉冲和噪声激励模型,合成语音有严重的机器声和噪声。对嗓音源序列建模拟合生成更为细致精确的嗓音源序列以合成高质量的语音,是近年来的研究热点及难点。
申请号为200810222508.0的中国专利公开了一种语音变调方法及装置,能够实现语音的自适应变调。但用户人群不同,需求也不同,由于该种变调方式无法通过手工设置升降调的幅度,因此不适应于希望按照自己的需求来固定地改变音调的用户。申请号为201610573399.1的中国专利公开了一种稳定音色的音乐语音变调方法,通过语音信号的倒谱序列导出频谱包络,从中分离出语音信号的激励分量,再计算经变调处理后的激励分量,并与频谱包络重新合成音调改变但音色稳定的音乐语音信号。该方法同样无法实现对嗓音源的灵活控制。
发明内容
本发明针对现有技术的不足,提出了一种基于微分声门波模型的语音变调变嗓音方法。
本发明采用线性预测编码(LPC)技术和微分声门波(LF)相结合的方法合成变调语音,将语音信号通过LPC逆滤波器得到的残差信号即为声门信号的一阶差分,用LF模型对其进行更细致的模拟得到高质量的声门激励信号,从而合成高质量的变调语音。LPC是目前最简单、最重要、最有效、最流行的语音分析技术之一,普遍应用于语音信号处理的各个方面,具有低速率传输和储存语音、计算简单快速,能够极为精确地估计语音参数等优点。LF模型通过对嗓音源参数的灵活控制,可以合成不同音色的语音,且模型参数具有明确的物理意义,属发音器官合成语音法范畴,是语音合成技术发展的潮流之一。
本发明的目的就是提供一种更为简单、有效、快速的、能够灵活改变嗓音源参数的语音变调、变嗓音的方法。本发明的目的可以通过以下技术方案来实现:一种基于微分声门波模型的语音变调变嗓音方法,该方法包括:
Step1:数字语音信号记为S,采样频率记为fs,对S进行预处理,包括:去除直流分量、预滤波、预加重、归一化一系列处理,得到预处理后的信号S1;其中预加重系数k1范围为-1.0k1-0.90;预滤波器为带通滤波器记为lvboqi1,通带频率范围60Hz~2000Hz,阻带范围55Hz~3400Hz;
Step2:对S1加窗分帧后得S2;
窗函数为矩形窗,分帧参数为:分段时长初步取tms,t范围10~30,精确值为t×fs左右2的整次幂;帧长、帧移、帧叠分别记为wlen、inc、overlap,wlen=t×fs左右2的整次幂,inc=wlen×k2,k2范围为1/5~1/2,帧叠overlap=wlen-inc,总帧数fn=fix((N-wlen)/inc)+1,其中N为信号的长度,fix为取整;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海泰亿格康复医疗科技股份有限公司,未经上海泰亿格康复医疗科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810083797.4/2.html,转载请声明来源钻瓜专利网。