[发明专利]基于深度学习与简单声学特征的零次语音转换系统和方法在审
申请号: | 202011204478.8 | 申请日: | 2020-11-02 |
公开(公告)号: | CN112382308A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 魏建国;谭智元;路文焕;徐君海 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/18;G10L25/24;G10L25/30;G10L25/48;G10L17/04 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘国威 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及机器学习、语音信号处理领域,为解决包含在内容隐表示中的源说话人基频信息与包含在说话人身份隐表示中的目标说话人基频信息之间存在冲突问题,本发明,基于深度学习与简单声学特征的零次语音转换系统和方法,包含以下几个模块:特征提取器:从音频文件中提取所需的声学特征;内容编码器:从声学特征中得到对应语句的内容隐表示;说话人身份编码器:从声学特征中得到对应说话人的隐表示;说话人身份矫正器:调整已有的说话人隐表示,提升其可用性;解码器:从重新组合的内容隐表示和说话人隐表示中发掘信息并重构声学特征;神经声码器即频谱反相器:利用重构后的声学特征重建音频。本发明主要应用于机器学习、语音信号处理场合。 | ||
搜索关键词: | 基于 深度 学习 简单 声学 特征 语音 转换 系统 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011204478.8/,转载请声明来源钻瓜专利网。