[发明专利]一种基于零次学习的跨语种音色转换系统及方法在审
申请号: | 202110217545.8 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112767958A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 杨镇川;张伟彬;徐向民;邢晓芬;陈艺荣 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L21/013 | 分类号: | G10L21/013;G10L25/87;G10L25/24;G10L25/30;G10L15/02;G10L15/06;G10L15/07;G10L19/02;G10L19/26 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于零次学习的跨语种音色转换系统及方法,该系统依次包括混合音素识别模块、音色转换模块、说话人编码模块、声码器模块。该系统将语音信号梅尔谱作为输入信号,通过一个音素识别模块提取其瓶颈特征,并对特征做归一化后传送到声学模型中,通过控制说话人参考向量,从而控制声学模型合成的梅尔谱,最后通过一个声码器合成音频。该系统能将一般说话人语音转换成指定说话人音色,并且适用于并未出现在训练数据库中的口音语料,能够适用于多地区方言的变声,具有广阔的应用前景。 | ||
搜索关键词: | 一种 基于 学习 语种 音色 转换 系统 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110217545.8/,转载请声明来源钻瓜专利网。