[发明专利]语音切分模型的训练方法、装置、电子设备及存储介质有效
申请号: | 202110735369.7 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113593528B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 张睿卿;何中军;李芝;吴华 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/06;G10L15/26;G06F40/58 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张梦瑶 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 切分 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种语音切分模型的训练方法,包括:
获取样本语音,并获取待训练的语音切分模型;
将所述样本语音划分为多个样本语音片段;
根据语音翻译模型对所述多个样本语音片段进行翻译,以生成多个样本文本片段;
根据所述多个样本文本片段和预设条件,生成所述多个样本语音片段的标签值,所述预设条件包括所述样本文本片段为整句样本语音翻译结果的前缀;以及
根据所述多个样本语音片段的标签值和所述多个样本语音片段对所述语音切分模型进行训练,以生成训练之后的所述语音切分模型。
2.根据权利要求1所述的方法,其中,将所述样本语音划分为多个样本语音片段,包括:
获取时间间隔;
根据所述时间间隔对所述样本语音进行划分,以生成多个语音片段,其中,所述多个语音片段包括所述样本语音;
将所述多个语音片段中的所述样本语音删除,以得到所述多个样本语音片段。
3.根据权利要求1所述的方法,其中,所述根据语音翻译模型对所述多个样本语音片段进行翻译,以生成多个样本文本片段,包括:
将所述多个样本语音片段输入至所述语音翻译模型;
通过所述语音翻译模型翻译所述多个样本语音片段,生成所述多个样本文本片段,其中,所述多个样本文本片段的语言与所述多个样本语音片的语言为不同语种。
4.根据权利要求1所述的方法,其中,所述根据所述多个样本文本片段和预设条件,生成所述多个样本语音片段的标签值,包括:
分别判断所述多个样本文本片段中的每个所述样本文本片段是否满足预设条件,并根据相应的判断结果生成所述标签值;其中,
如果所述样本文本片段满足预设条件,则所述样本文本片段对应的样本语音片段的标签值为“1”;
如果所述样本文本片段不满足预设条件,则所述样本文本片段对应的样本语音片段的标签值为“0”。
5.根据权利要求1所述的方法,其中,所述根据所述多个样本语音片段的标签值和所述多个样本语音片段对所述语音切分模型进行训练,包括:
将所述样本语音片段输入所述语音切分模型以生成预测的标签值;
根据所述预测的标签值和所述样本语音片段对应的标签值,生成损失值;
根据所述损失值对所述语音切分模型进行训练。
6.一种语音切分模型的训练装置,包括:
获取模块,用于获取样本语音,并获取待训练的语音切分模型;
划分模块,用于将所述样本语音划分为多个样本语音片段;
第一生成模块,用于根据语音翻译模型对所述多个样本语音片段进行翻译,以生成多个样本文本片段;
第二生成模块,用于根据所述多个样本文本片段和预设条件,生成所述多个样本语音片段的标签值,所述预设条件包括所述样本文本片段为整句样本语音翻译结果的前缀;以及
训练模块,用于根据所述多个样本语音片段的标签值和所述多个样本语音片段对所述语音切分模型进行训练,以生成训练之后的所述语音切分模型。
7.根据权利要求6所述的装置,其中,所述获取模块,具体用于:
获取时间间隔;
根据所述时间间隔对所述样本语音进行划分,以生成多个语音片段,其中,所述多个语音片段包括所述样本语音;
将所述多个语音片段中的所述样本语音删除,以得到所述多个样本语音片段。
8.根据权利要求6所述的装置,其中,所述第一生成模块,具体用于:
将所述多个样本语音片段输入至所述语音翻译模型;
通过所述语音翻译模型翻译所述多个样本语音片段,生成所述多个样本文本片段,其中,所述多个样本文本片段的语言与所述多个样本语音片的语言为不同语种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110735369.7/1.html,转载请声明来源钻瓜专利网。