[发明专利]信息处理方法及信息处理系统在审
申请号: | 201980072848.6 | 申请日: | 2019-11-06 |
公开(公告)号: | CN112970058A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 大道龙之介;梅利因·布洛乌;若尔迪·博纳达 | 申请(专利权)人: | 雅马哈株式会社 |
主分类号: | G10L13/00 | 分类号: | G10L13/00;G10L13/033;G10L13/047 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 何立波;张天舒 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 系统 | ||
1.一种信息处理方法,其是通过计算机实现的信息处理方法,
将表示发音源的发音源数据、表示发音风格的风格数据和表示发音条件的合成数据输入至通过机器学习而生成的合成模型,由此基于所述发音风格及所述发音条件而生成表示应该由所述发音源进行发音的目标音的音响特征的特征数据。
2.根据权利要求1所述的信息处理方法,其中,
所述发音条件包含针对每个音符的音高。
3.根据权利要求1或2所述的信息处理方法,其中,
所述发音条件包含所述目标音的音位。
4.根据权利要求1至3中任一项所述的信息处理方法,其中,
向所述合成模型输入的所述发音源数据是与不同的发音源相对应的多个发音源数据之中的由利用者选择出的发音源数据。
5.根据权利要求1至4中任一项所述的信息处理方法,其中,
向所述合成模型输入的风格数据是与不同的发音风格相对应的多个风格数据之中的由利用者选择出的风格数据。
6.根据权利要求1至5中任一项所述的信息处理方法,其中,
所述信息处理方法还通过将表示新发音源的新发音源数据、表示与所述新发音源相对应的发音风格的风格数据和表示由所述新发音源进行的发音的发音条件的新合成数据输入至所述合成模型,由此基于所述新发音源的发音风格及由所述新发音源进行的发音的发音条件而生成表示由所述新发音源进行发音的音响的音响特征的新特征数据,
对所述新发音源数据及所述合成模型进行更新,以使得与基于所述新合成数据所表示的发音条件而由所述新发音源发音出的音响相关的已知特征数据和所述新特征数据的差异减少。
7.根据权利要求1至6中任一项所述的信息处理方法,其中,
所述发音源数据表示第1空间中的向量,所述第1空间表示与由不同的多个发音源进行发音的音响的特征相关的所述多个发音源之间的关系,
所述风格数据表示第2空间中的向量,所述第2空间表示与通过不同的多个发音风格进行发音的音响的特征相关的所述多个发音风格之间的关系。
8.根据权利要求1至7中任一项所述的信息处理方法,其中,
所述合成模型包含:
第1生成模型,其生成所述目标音的基本频率的时间序列;以及
第2生成模型,其与由所述第1生成模型生成的基本频率的时间序列相应地生成所述目标音的频谱包络的时间序列。
9.根据权利要求8所述的信息处理方法,其中,
所述信息处理方法还与来自利用者的指示相应地对由所述第1生成模型生成的基本频率的时间序列进行编辑,所述第2生成模型与所述编辑后的基本频率的时间序列相应地生成所述目标音的频谱包络的时间序列。
10.一种信息处理系统,其具有合成处理部,
该合成处理部将表示发音源的发音源数据、表示发音风格的风格数据和表示发音条件的合成数据输入至通过机器学习而生成的合成模型,由此基于所述发音风格及所述发音条件而生成表示应该由所述发音源进行发音的目标音的音响特征的特征数据。
11.一种信息处理系统,其具有大于或等于1个处理器和大于或等于1个存储器,
通过执行在所述大于或等于1个存储器中存储的程序,所述大于或等于1个处理器将表示发音源的发音源数据、表示发音风格的风格数据和表示发音条件的合成数据输入至通过机器学习而生成的合成模型,由此基于所述发音风格及所述发音条件而生成表示应该由所述发音源进行发音的音响的音响特征的特征数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅马哈株式会社,未经雅马哈株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980072848.6/1.html,转载请声明来源钻瓜专利网。