[发明专利]语音字体说话者以及韵律插值有效
申请号: | 201910916818.0 | 申请日: | 2015-02-23 |
公开(公告)号: | CN110718209B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 栾剑;L·何;M·梁 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/033 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 贾丽萍 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了多语音字体插值。多语音字体插值引擎允许通过对来自现有的字体的说话者特性和韵律进行插值,而产生具有宽泛的多种说话者特性和/或韵律的计算机生成的话音。使用来自多语音字体的预测模型,多语音字体插值引擎预测对从待说出的文本中所获得的音素序列的说话者特性和/或韵律有影响的参数的值。对于每个参数,通过根据所预测的值的加权的插值而生成额外的参数值。利用经插值的参数值来修改现有的语音字体改变了话音的风格和/或情绪,同时保留了原始的语音的基本音质。多语音字体插值引擎允许说话者特性和/或韵律从一个语音字体移植到另一个语音字体,或者允许针对现有的语音字体而生成全新的说话者特性和/或韵律。 | ||
搜索关键词: | 语音 字体 说话 以及 韵律 | ||
【主权项】:
1.一种用于呈现用户界面以针对从源语音字体推导的计算机生成的话音生成多语音字体的方法,所述方法包括以下步骤:/n标识多个源语音字体;/n生成用户界面,所述用户界面包括与所述多语音字体的语音字体特性相关联的源语音字体权重选择控件,所述源语音字体权重选择控件允许基于所述源语音字体权重选择控件针对所述多个源语音字体中的每个源语音字体的位置来向所述多个源语音字体中的每个源语音字体分配相对于所述其它源语音字体中的每个源语音字体的相对权重,以便控制所述多个源语音字体中的每个源语音字体对所述多语音字体的所述语音字体特性的贡献;以及/n显示所述用户界面。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910916818.0/,转载请声明来源钻瓜专利网。