[发明专利]针对多种语言处理内容的语音合成有效
申请号: | 201380017905.3 | 申请日: | 2013-03-04 |
公开(公告)号: | CN104380284B | 公开(公告)日: | 2018-01-30 |
发明(设计)人: | C·B·弗雷扎齐;D·C·米尼菲 | 申请(专利权)人: | 苹果公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G10L13/033 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 鲍进 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 多种 语言 处理 内容 语音 合成 | ||
背景技术
本发明所公开的实施例整体涉及文本到语音合成,并且更具体地涉及允许用户从多种语言中选择要用于执行文本到语音合成或转换的语言的技术。
语言文本转换成语音的过程通常称为文本到语音合成或文本到语音转换。由于人类所说语言的多样性,各种语言可用于执行文本到语音转换。能够以多种语言执行文本到语音转换的系统通常提供多种语言合成器,每个语言合成器被配置为以特定语言将文本转换成语音。例如,英语语言合成器可提供用于将文本转换成英语语音,法语语言合成器可提供用于将文本转换成法语语音,日语语言合成器可提供用于将文本转换成日语语音等等。取决于要用于语音的特定语言,对应于特定语言的语言合成器被用于执行文本到语音转换。
对于共用字符的语言(诸如英语、法语和德语)来说,同一段文本可使用对应于这些语言的合成器中的任何合成器来转换成语音。然而,因为用于特定语言的合成器使用特定于该语言的读音规则和发音,所以对于不同合成器来说,同一段文本的语音输出听起来将有所不同。例如,从使用英语合成器对一段文本进行文本到语音转换得到的语音听起来可能与从使用法语合成器对同一段文本进行文本到语音转换得到的语音非常不同。
在常规系统中,一般自动选择默认语言合成器来执行文本到语音转换,只要默认合成器可输出正在转换的文本的语音即可。然而,这可能产生用户不期望的语音结果。例如,如果要转换的文本是法语语言并且英语语言合成器是默认合成器,那么输出可能是以严重英语口音说出的法语。
发明内容
描述了允许用户从多种语言中选择要用于执行文本到语音转换的语言的某些实施例。
在一些实施例中,可将多种语言显示给用户。用户可随后从多种语言中选择要使用的特定语言。用户选择的语言可随后用于产生要转换成语音的文本的语音。
在一些实施例中,在确定可适于执行文本的一部分的文本到语音转换的多种语言时,可将该多种语言显示给用户。用户可随后从多种语言中选择要使用的特定语言。当产生文本的语音时,可以用户选择的语言将文本的该部分转换成语音。
在一些实施例中,使用一个或多个分析准则来分析要转换成语音的文本。基于分析,可将一种或多种语言确定为可适用于将文本转换成语音。在一些情况下,分析可产生适用于文本的相同部分的多种语言。在这种情景下,可将多种语言输出给用户。用户可随后从多种语言中选择特定语言。随后使用对应于用户选择的语言的语言合成器,以用户选择的语言将文本的该部分转换成语音。
文本的该部分(可针对文本的该部分将多种语言识别为可能的候选语言)可以是要转换成语音的整个文本或该文本的子集。文本的子集可以是例如但不限于文本内的一个或多个字符、文本内的一个或多个词、文本内的一个或多个句子等等。
在一些实施例中,用以识别要用于将文本转换成语音的一种或多种语言的对文本的分析可基于各种准则。准则的例子可包括但不限于:一个或多个加载的键盘、与文本相关联的一个或多个标签、在分析要转换成语音的文本时由语言分析工具识别的一种或多种语言、专用数据(例如,托管网页的网站的域信息、即时消息应用程序的发送方电话号码)、与文本中的一个或多个字符相关联的字符编码信息(例如Unicode信息)、一个或多个用户偏好(例如,语言或场所偏好)、用户历史信息(例如,用于文本到语音转换的先前用户语言选择)、文本的来源、与文本相关联的国家代码顶级域信息、全球定位系统(GPS)信息(例如,识别用户或用户设备的位置)等等。这些准则的各种组合用于各种实施例,以便识别要用于将文本转换成语音的一种或多种语言。
在一些实施例中,对包括多种语言的文本来说,用于执行文本到语音转换的语言合成器自动地针对不同语言进行切换。在一些实施例中,可逐字符地处理文本并且确定要用于将字符转换成语音的语言。可识别要转换成语音的文本中的字符范围,每一个范围与一种语言相关联。当将文本转换成语音时,每一个范围部分是使用对应于与该范围相关联的语言的语言合成器来转换成语音。这允许语言合成器在文本到语音转换期间自动地切换,以便促进文本到语音的转换。
在一些实施例中,文本到语音转换可提供为基于web的服务或云服务,或可在软件即服务(Software as a Service,SaaS)模型下提供。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380017905.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高性能互连相干协议
- 下一篇:一种用于传声器风噪声抑制的装置