[发明专利]语音字体说话者以及韵律插值有效
申请号: | 201910916818.0 | 申请日: | 2015-02-23 |
公开(公告)号: | CN110718209B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 栾剑;L·何;M·梁 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/033 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 贾丽萍 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 字体 说话 以及 韵律 | ||
1.一种用于呈现用户界面以针对从源语音字体推导的计算机生成的话音生成多语音字体的方法,所述方法包括以下步骤:
标识多个源语音字体;
生成用户界面,所述用户界面包括与所述多语音字体的语音字体特性相关联的源语音字体权重选择控件,所述源语音字体权重选择控件允许基于所述源语音字体权重选择控件针对所述多个源语音字体中的每个源语音字体的位置来向所述多个源语音字体中的每个源语音字体分配相对于其它源语音字体中的每个源语音字体的相对权重,以便控制所述多个源语音字体中的每个源语音字体对所述多语音字体的所述语音字体特性的贡献;以及
显示所述用户界面。
2.根据权利要求1所述的方法,其中,所述用户界面还包括:允许调整所述多语音字体的整体属性的多语音字体属性控件。
3.根据权利要求2所述的方法,其中,所述多语音字体属性控件是与从包括话音速率、音高水平和音高范围的一群多语音字体属性中选择的多语音字体属性相关联的。
4.根据权利要求1所述的方法,其中,所述用户界面还包括:允许标识所述多个源语音字体的语音字体选择控件。
5.根据权利要求1所述的方法,还包括以下步骤:
获得待被渲染成计算机生成的话音的文本;以及
使用所述多语音字体来将所述文本渲染成计算机生成的话音。
6.根据权利要求5所述的方法,其中,使用所述多语音字体来将所述文本渲染成话音包括:
针对每个源语音字体来预测所述文本的特性值;
基于被分配给所述多个源语音字体中的每个源语音字体的相对权重来合并所预测的特性值以产生经插值的特性值;以及
使用所述经插值的特性来将所述文本渲染成计算机生成的话音。
7.根据权利要求5所述的方法,其中,所述用户界面还包括:允许输入文本以用于文本话音转换渲染的文本输入控件,并且其中,获得待被渲染成计算机生成的话音的文本的步骤包括:从所述文本输入控件获得所述文本。
8.根据权利要求5所述的方法,还包括以下步骤:经由音频输出换能器来播放所述经渲染的文本。
9.根据权利要求5所述的方法,其中,所述用户界面还包括话音保存控件,并且所述方法还包括以下步骤:响应于对所述话音保存控件的致动而将所述经渲染的文本保存为音频文件。
10.根据权利要求1所述的方法,其中,所述用户界面还包括:包含多个语音字体特性标签选择器的语音字体特性标签选择控件,所述多个语音字体特性标签选择器中的每个语音字体特性标签选择器与包括用于不同语音字体特性的源语音字体权重选择控件的语音字体特性标签相关联,并且其中,所述方法还包括以下步骤:
接收对语音字体特性标签选择器的用户选择;以及
响应于接收对所述语音字体特性标签选择器的所述用户选择,显示与所选择的语音字体特性标签选择器相关联的语音字体特性标签。
11.根据权利要求1所述的方法,其中,所述源语音字体权重选择控件是与从包括以下各项的一群语音字体特性中选择的语音字体特性相关联的:持续时间语音字体特性、f0语音字体特性、以及频谱语音字体特性。
12.根据权利要求1所述的方法,其中,所述用户界面还包括:允许保存所述多语音字体以供再次使用的字体保存控件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910916818.0/1.html,转载请声明来源钻瓜专利网。