[发明专利]自适应文本转话音输出有效
申请号: | 201680080197.1 | 申请日: | 2016-12-29 |
公开(公告)号: | CN108604446B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 马修·谢里菲;雅各布·尼古劳斯·弗尔斯特 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G06F40/289;G06F40/253 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应 文本 话音 输出 | ||
在一些实施方式中,由一个或多个计算机确定客户端设备的用户的语言熟练度。然后,一个或多个计算机基于用户的所确定的语言熟练度来确定用于由文本转话音模块输出的文本片段。在确定用于输出的文本片段之后,一个或多个计算机生成包括文本片段的合成话语的音频数据。然后,将包括文本片段的合成话语的音频数据提供给客户端设备以用于输出。通过更好的文本转话音转换而提供改善的用户接口。
相关申请的交叉引用
本申请要求于2016年1月28日提交、名称为“ADAPTIVE TEXT-TO-SPEECH-OUTPUTS(自适应文本到话音输出)”的美国申请序列号15/009,432的优先权,其全部内容通过引用并入本文。
技术领域
本说明书总体上涉及电子通信。
背景技术
话音合成指代人工制作人类话音。话音合成器能够在软件或硬件组件中实现,以生成对应于文本的话音输出。譬如,文本转话音(TTS)系统通常通过串接数据库中存储的录制话音段而将正常的语言文本转换成话音。
发明内容
随着电子计算中的更大部分已经从桌面转移到移动环境,话音合成对于用户体验而言变得愈加重要。例如,不带显示器的较小移动设备的使用率增长导致了使用文本转话音(TTS)系统来访问和使用移动设备上显示的内容日益增多。
本说明书公开了改进的用户接口,特别是通过改进的TTS来增强计算机到用户的通信。
现有TTS系统的一个特殊问题是,这样的系统往往无法适应不同用户的不同语言熟练度。这种灵活性欠缺往往会妨碍语言熟练度有限的用户理解复杂的文本转话音输出。譬如,使用TTS系统的非母语说话者可能由于他们的语言熟练度有限而难以理解文本转话音输出。现有TTS系统的另一个问题是,用户理解文本转话音输出的即时能力也可能随特定的用户场境(context)而变化。譬如,一些用户场境包括背景噪声,这可能会使其愈加难以理解更长或更复杂的文本转话音输出。
在一些实施方式中,系统基于用户的语言熟练度来调整用于文本转话音输出的文本,以提高用户能够领会文本转话音输出的可能性。譬如,能够从在先用户活动推断用户的语言熟练度,并且将其用于将文本转话音输出调整成与用户的语言熟练度相称的适当复杂度。在一些示例中,系统获得多个候选文本片段,它们对应于不同水平的语言熟练度。然后,该系统选择与用户的语言熟练度最匹配且最密切对应的候选文本片段,并且提供所选文本片段的合成话语以供输出给用户。在其他示例中,系统在生成文本转话音输出之前将文本片段中的文本更改成更好地对应于用户的语言熟练度。能够调整文本片段的各个方面,包括词汇表、语句结构、长度等。然后,该系统提供更改后的文本片段的合成话语以供输出给用户。
针对本文讨论的系统收集关于用户的个人信息或者可以利用个人信息的情形,可以向用户提供机会来控制程序或特征是否收集个人信息(例如,关于用户社交网络、社交动作或活动、职业、用户偏好、或用户当前位置的信息),或者控制是否和/或如何从内容服务器接收可能与用户更相关的内容。此外,在存储或使用某些数据之前可以通过一种或多种方式将其匿名化,使得移除个人可识别信息。例如,用户的身份可以被匿名化,使得无法确定用户的个人可识别信息,或者在获得位置信息的情况下可以将用户的地理位置泛化(诸如到城市、邮政编码或州层级),使得无法确定用户的特定位置。因此,用户可以控制如何收集关于他或她的信息以及如何供内容服务器使用该信息。
在一方面,一种计算机实现的方法能够包括:由一个或多个计算机确定客户端设备的用户的语言熟练度;由所述一个或多个计算机基于所述用户的所确定的语言熟练度来确定供文本转话音模块输出的文本片段;由所述一个或多个计算机生成包括所述文本片段的合成话语的音频数据;以及由所述一个或多个计算机向所述客户端设备提供包括所述文本片段的所述合成话语的所述音频数据。
其他版本包括对应的系统和计算机程序,其被配置成执行计算机存储设备上编码的方法的动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680080197.1/2.html,转载请声明来源钻瓜专利网。