[发明专利]一种基于指向目标人变声比例参数的语音变声方法及装置在审
申请号: | 201610036866.7 | 申请日: | 2016-01-20 |
公开(公告)号: | CN105654941A | 公开(公告)日: | 2016-06-08 |
发明(设计)人: | 宁更新;钟英文;杨文圣;张军;冯义志;季飞 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L13/033 | 分类号: | G10L13/033;G10L13/04;G10L19/00 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 罗观祥 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 指向 目标 变声 比例 参数 语音 方法 装置 | ||
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种基于指向目标人变声比例参数的语音 变声方法及装置。
背景技术
在语音信号处理领域中,语音变声是一个重要的分支,具有重要的学术研究价值和应用价 值。目前语音变声已有不少方法,传统的方法基本上是基于以下三种思想:第一种方法是在 时域上处理语音信号,通过缩放时域长度来改变信号的频率,再通过插值法使新信号长度与 原信号保持一致(CN03137014.4);第二种方法是在频域上进行处理,即先对语音信号进行插 值或抽检,再对其作傅里叶变换,在频域上使其频谱整体搬移一段距离,最后再将其变换回 时域,从而达到改变语音信号频率的效果(CN200410062337.1)。第三种方法,从发声系统角 度出发设计,在系统域上,求出声道对应的极点,通过调节声道系统的极点的幅值和相角等 参数实现极点搬移,从而改变声道系统,来实现语音变声(CN102592590B)。
由此可见,方法一和方法二都是将信号在频域或时域进行直接处理,使之频率改变,从 而达到变声的效果。但是这些方法都没从发音系统角度出发设计,使得变声后语音的谐波关 系保持的不佳,造成了语音的不自然。方法三,针对方法一和二的缺点,从系统域的角度去 设计,确实是消除了变声后语音的不自然、有机器味的缺点,但是方法三无法往特定目标人 语音变化,它只是通过盲目地调节变声参数,无方向地搬移极点,也即无方向地改变声道系 统,所以也就不能变化出特定目标人的语音,不能适应语音变声的实际应用需求。
本发明在方法三的基础上出发,同样是从声音的产生过程出发,在系统域上进行处理, 但是本方法,在极点的搬移上,引入特定目标人的语音,根据使用者语音和目标人语音来共 同确定变声比例参数,这样搬移后的极点对应的声道系统会具有“指向性”,变化出来的语音 更像特定目标人发出来的语音,这一方法可以有效解决先前方法中的不足,不仅实现了语音 变声的自然变声,而且还可往特定目标人语音变化。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于指向目标人变声比例参数 的语音变声方法及装置,克服现有变声方法存在的变声语音不自然、机器味重、以及不能往 特定目标人语音变化等缺点。
本发明的目的通过如下技术方案实现:一种基于指向目标人变声比例参数的语音变声方 法,具体包括以下步骤:
S1、从发声原理出发建立声道模型,并求得发音系统的传递函数和极点;
所述步骤S1具体为:由人声道发声原理可知,可使用如下R阶的声道模型:
其中G[n]是声带振动产生的一个激励,y[n]是G[n]通过声道后输出的信号,系数ak即 为声道模型的参数,可由杜宾算法等估计算法来提取,可知上式是一个R阶全极点的AR模 型,所以它的系统函数H(z),也即声道的系统函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610036866.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音唤醒方法及装置
- 下一篇:废旧羽毛球回收利用型环保风铃