[发明专利]乐器音色转换模型构建方法以及乐器音色转换方法在审

申请号：	202210225202.0	申请日：	2022-03-09
公开（公告）号：	CN114550735A	公开（公告）日：	2022-05-27
发明（设计）人：	张剑;蒋慧军;徐伟;陈又新;肖京	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L21/007	分类号：	G10L21/007;G10L25/30;G10L25/48
代理公司：	北京英特普罗知识产权代理有限公司 11015	代理人：	王勇
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	乐器音色转换模型构建方法以及
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种乐器音色转换模型构建方法，其特征在于，包括：

采集多个第一样本音频数据，其中，第一样本音频数据为基于第一类型乐器演奏得到的音频数据；

将所述多个第一样本音频数据转化为多个第一样本音频向量序列，并将所述多个第一样本音频向量序列输入至待训练模型中；

通过所述待训练模型将所述多个第一样本音频向量序列转换为第二样本音频向量序列，其中，第二样本音频向量序列为基于模拟第二类型乐器演奏得到的音频数据对应的向量序列；

将每个第二样本音频向量序列恢复为对应的输入样本音频向量序列，其中，所述输入样本音频向量序列为基于模拟所述第一类型乐器演奏得到的音频数据对应的向量序列；

将所述输入样本音频向量序列与对应的第一样本音频向量序列进行比对，并得到第一损失值；

基于多个第二样本音频向量序列，获取每个第二样本音频向量序列对应的第一分值；

基于所述第一分值和所述第一损失值，更新所述待训练模型的模型参数；

根据更新后的模型参数得到乐器音色转换模型。

2.根据权利要求1所述的乐器音色转换模型构建方法，其特征在于，所述待训练模型包括第一转换器、第二转换器、第一辨别器和第二辨别器，所述第一转换器用于将所述第一样本音频向量序列转换为所述第二样本音频向量序列；所述第二转换器用于将第三样本音频向量序列转换为第四样本音频向量序列，其中，所述第三样本音频数据为基于所述第二类型乐器演奏得到的音频数据对应的向量序列，所述第四样本音频向量序列为基于模拟所述第一类型乐器演奏得到的音频数据对应的向量序列；所述第一辨别器用于辨别音频数据是否为模拟所述第一类型乐器演奏得到的数据；所述第二辨别器用于辨别音频数据是否为模拟所述第二类型乐器演奏得到的数据；

所述基于所述第一分值和所述第一损失值，更新所述待训练模型的模型参数，还包括：

在所述第二转换器和所述第二辨别器的模型参数不变的情形下，根据所述第一损失值，通过反向传播算法获取所述第一转换器中各个神经元的第一误差；

根据所述第一转换器中的各个第一误差，更新所述第一转换器的模型参数；

基于所述第一转换器更新后的模型参数和所述第一分值，更新所述第一辨别器的模型参数。

3.根据权利要求2所述的乐器音色转换模型构建方法，其特征在于，所述根据更新后的模型参数得到乐器音色转换模型，还包括：

根据更新后的模型参数，得到更新后的待训练模型；

对更新后的待训练模型中的模型参数进行预设次数更新后，得到所述乐器音色转换模型。

4.根据权利要求2所述的乐器音色转换模型构建方法，其特征在于，所述将所述多个第一样本音频数据转化为多个第一样本音频向量序列，还包括：

对每个第一样本音频数据进行分帧处理，并得到多帧第一子样本音频数据；

对每帧第一子样本音频数据进行傅里叶变换，得到所述每帧第一子样本音频数据对应的幅值；

根据所述每帧第一子样本音频数据的幅值，得到线性谱；及

对所述线性谱进行加权求和，得到第一样本音频数据对应的第一样本音频向量序列。