[发明专利]预测通信系统中使用的文本信息的音调模式信息有效

专利信息
申请号: 200580033278.8 申请日: 2005-08-02
公开(公告)号: CN101069230A 公开(公告)日: 2007-11-07
发明(设计)人: 丁丰;曹阳 申请(专利权)人: 诺基亚公司
主分类号: G10L13/08 分类号: G10L13/08;G10L15/18
代理公司: 北京市金杜律师事务所 代理人: 吴立明
地址: 芬兰*** 国省代码: 芬兰;FI
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 预测 通信 系统 使用 文本 信息 音调 模式
【说明书】:

技术领域

本发明一般地涉及通信系统中的语音识别和文本到语音(TTS) 合成技术。更具体地,本发明涉及预测通信系统中使用的文本信息 的音调模式信息。

背景技术

该部分旨在提供针对权利要求书中所叙述的本发明的背景或环 境。这里的描述可以包括可被遵循的概念,但不必是先前已经设想 或遵循的概念。因此,除非在这里另外指出,否则在该部分所描述 的内容不是本申请的权利要求书中的现有技术并且不会因为包括在 这里而被认为是现有技术。

语音可被用于结合移动终端进行输入和输出。例如,语音识别 和文本到语音(TTS)合成技术使用语音以结合移动终端进行输入和 输出。这样的技术尤其适用于残疾人士或当移动终端用户无法轻松 自如地使用他或她的手时。这些技术还能够给出有声的反馈,使得 用户不必盯着设备。

音调对于汉语(例如,普通话、广东话和其它方言)和其它语 言来说是重要的。音调主要特征在于其基频(F0)轮廓的形状。例 如,如图1中所示,普通话音调1、2、3和4可以被分别地描述为: 阴平(highlevel)、阳平(high-rising)、上声(low-dipping)和去 声(high-falling)。轻声(音调0)不具有特定的F0轮廓,其高度 地依赖于在前的音调并且通常被认为是短暂的。

类似汉语的音调语言中的文本到语音是具有挑战性的,因为通 常在文本呈现中没有可用的音调信息。然而,音调信息对于理解是 至关重要的。相邻音节的音调组合可形成某些音调模式。另外,音 调可显著地影响语音感知。例如,音调信息对于汉语语音输出是至 关重要的。在英语中,句子的不正确的音调变化可致使句子难以理 解。在汉语中,单个字词的不正确的语调可完全改变它的意思。

在许多情况下,音节的音调信息是无法获得的。例如,汉语电 话用户在电话目录(“联系人姓名”)中可具有拼音格式的姓名。 拼音是用于将汉语表意文字拼写成罗马字母的一种系统,由中华人 民共和国1979年正式采用。用于联系人姓名的拼音格式可能不包括 音调信息。从联系人姓名本身直接获得音调信息是不太可能的。在 没有音调或具有不正确的音调的情况下,从文本生成的语音在质量 上是糟糕的并且可以完全改变文本的意思。

美国专利申请2002/0152067(该申请被转让给与本申请相同的 受让人)公开了一种方法,其中用于姓名或字词的发音模型可从位 于网络中的服务器获得。然而,该专利申请仅描述涉及发音的解决 方案。没有包括或暗示音调信息的使用。如上所指出的,在没有音 调信息的情况下,重要的意思会被丢失。

国际专利申请WO3065349公开了向文本到语音生成添加音调 信息以提高文本的可理解性。该专利申请所描述的技术使用了对句 子的上下文的分析。基于字词所位于的其它的上下文来识别音调。 然而,这样的上下文不总是可用的,特别是结合例如移动电话的通 信系统,并且文本也不总是提供生成音调信息所需的线索。

因此,需要不依赖于上下文而预测音节序列的音调模式。进一 步,需要预测音调模式以正确地识别用作移动设备的联系人的姓名。 更进一步,当无法获得音调信息时,需要合成通信终端中的联系人 姓名。更进一步,对于类似汉语的语言,需要从文本生成音调信息, 其中音调信息对于通信和理解是至关重要的。

发明内容

一般地,本发明涉及从文本条目生成音调信息,并且进一步使 用决策树将该音调信息应用到拼音序列。至少一个示例性的实施方 式涉及一种预测计算机系统中使用的文本信息的音调模式信息的方 法。该方法包括将文本条目分解成段并利用分解的段来识别文本条 目的音调信息。可利用决策树生成音调信息。还可在分布式系统中 实现该方法,其中在后端服务器处执行该转化并且在请求之后将该 信息发送到通信设备。

另一个示例性实施方式涉及一种设备,该设备基于文本信息而 不是文本信息的上下文来预测文本信息的音调模式信息。该设备包 括处理模块和存储器。处理模块执行编程的指令而存储器包含编程 的指令以将文本条目分解成段并利用分解的段来识别文本条目的音 调信息。

另一个示例性实施方式涉及一种系统,该系统基于文本信息而 不是文本信息的上下文来预测文本信息的音调模式信息。该系统包 括终端装置设备和处理模块,该终端装置设备具有一个或多个存储 在其上的文本条目而处理模块将文本条目分解成段并且利用分解的 段来识别文本条目的音调信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200580033278.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top