[发明专利]一种语音合成模型训练平台在审
申请号: | 202211680618.8 | 申请日: | 2022-12-26 |
公开(公告)号: | CN116010815A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 王正;江明奇;杨喜鹏;殷昊;陈云琳 | 申请(专利权)人: | 上海墨百意信息科技有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G10L13/02 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 胡春娇 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 合成 模型 训练 平台 | ||
本申请提供了一种语音合成模型训练平台;所述平台包括:前端模块,用于创建训练任务;后端模块,用于获取前端模块创建的训练任务,若查询到存在图形处理器(GPU)的空闲核心,则将所述空闲核心的计算资源分配给所述训练任务;算法模块,用于对所述训练任务进行训练,得到训练任务的训练结果。本申请提供的语音合成模型训练平台,在创建训练任务确定之后,用户将不用再进行任何操作,直接等待最后的训练结果即可,解决了语音模型训练流程复杂的问题,提高了训练准确率。
技术领域
本申请涉及语音合成技术领域,尤其涉及一种语音合成模型训练平台。
背景技术
使用传统方式进行语音模型训练时,通常需要标注人员进行填写训练任务的相关信息后交给算法团队进行训练。该过程不仅步骤较多,效率较低,而且需要确保每一步都没有失误才能保证最后的训练成功。若中间过程出现错误,则会导致训练失败的情况发生。
因此,有必要设计一种提高模型任务训练效率和准确率的方案。
发明内容
本申请实施例提供一种语音合成模型训练平台,可以提高语音合成模型的训练任务的训练效率以及准确率。
本申请实施例的技术方案是这样实现的:
第一方面,本申请实施例提供一种语音合成模型训练平台,包括:
前端模块,用于创建训练任务;
后端模块,用于获取前端模块创建的训练任务,若查询到存在GPU的空闲核心,则将所述空闲核心的计算资源分配给所述训练任务;
算法模块,用于对所述训练任务进行训练,得到训练任务的训练结果。
在上述方案中,所述前端模块,具体用于:
根据用户名和标注任务名称生成训练任务名称;
确定发音人名称、确定采样率、确定发音人风格、确定发音人性别、确定是否重读。在上述方案中,所述前端模块还用于显示以下至少一项训练任务的任务列表:
正在准备训练的任务列表、正在训练中的任务列表、训练成功完成的任务列表、训练完成失败的任务列表和已经取消训练的任务列表中至少一项。
在上述方案中,所述前端模块还用于:
对训练成功完成的训练任务输出试听语音。
在上述方案中,所述前端模块还用于:
对训练成功完成的训练任务,接收自定义文本的输入;
基于所述自定义文本和训练任务的训练结果所对应的发音人的声音,输出与自定义文本对应的语音。
在上述方案中,所述前端模块还用于:
取消正在准备训练的训练任务。
在上述方案中,所述后端模块还用于:
若未查询到图形处理器(Graphic Processing Unit,GPU)的空闲核心,则等待第一时间后,再次查询所述图像处理器GPU是否存在空闲核心。
在上述方案中,所述后端模块还用于:
获取算法模块中的所述训练任务的训练结果;
对所述训练结果进行解析,得到解析结果;
将所述解析结果发送给前端模块。
在上述方案中,所述后端模块还用于:
在所述训练任务结束之后,释放所述空闲核心。
在上述方案中,所述后端模块还用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海墨百意信息科技有限公司,未经上海墨百意信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211680618.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:铰链机构和电子设备
- 下一篇:燃料电池集成系统的优化方法、装置、设备及产品