[发明专利]一种音色转换方法、装置、电子设备及可读存储介质在审
申请号: | 202110790316.5 | 申请日: | 2021-07-13 |
公开(公告)号: | CN113611309A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 王愈;武卫东;陈明;李健 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L25/24;G10L25/30;G10L21/013;G10L21/007 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种音色转换方法、装置、电子设备及可读存储介质,涉及音频处理技术领域。其中,所述方法包括:提取待转换语音的输入谱参数;基于所述输入谱参数,确定第一语音文本参数;基于所述音色转换模型,对所述输入谱参数进行变分自编码处理及注意力机制处理,确定所述语音声音参数;基于所述音色转换模型,对所述语音声音参数及所述第一语音文本参数进行处理,确定输出谱参数;基于所述输出谱参数,得到音色转换后的目标语音。通过在变分自编码处理获得语音声音参数的过程中,加入注意力机制处理,可以提升VAE模型克服音频波动的鲁棒性,从而进一步提升音色转换模型对误识别的纠错和容错,保证音色转换的转换效果,提高音色转换的可靠性。 | ||
搜索关键词: | 一种 音色 转换 方法 装置 电子设备 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110790316.5/,转载请声明来源钻瓜专利网。