[发明专利]提供特征变换的有效评估的方法、装置、移动终端以及计算机程序产品无效
申请号: | 200780015664.3 | 申请日: | 2007-03-09 |
公开(公告)号: | CN101432800A | 公开(公告)日: | 2009-05-13 |
发明(设计)人: | J·田;J·K·尼尔米南;V·波帕 | 申请(专利权)人: | 诺基亚公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L17/00 |
代理公司: | 北京市金杜律师事务所 | 代理人: | 冯 谱 |
地址: | 芬兰*** | 国省代码: | 芬兰;FI |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提供 特征 变换 有效 评估 方法 装置 移动 终端 以及 计算机 程序 产品 | ||
技术领域
本发明的实施方式总体上涉及特征变换技术,并且更具体地,涉 及用于提供对变换任务中高斯混合模型(GMM)的有效评估的方法、 装置以及计算机程序产品。
背景技术
现代通信时代带来了有线和无线网络的极大扩展。在消费者需求 的驱动下,计算机网络、电视网络和电话网路正在经历前所未有的技 术扩展。无线和移动网络技术已经解决了相关的消费者需求,同时提 供了更为灵活和直接的信息传送。
当前和未来的网络技术持续促进信息传送的简易性以及对用户 的便利性。需要提高信息传送简易性的一个领域涉及对移动终端用户 的服务递送。服务可以是以用户所期望的特定媒体或者通信应用的形 式,诸如音乐播放器、游戏机、电子书、短消息、电子邮件等等。服 务的形式还可以是交互式应用,其中,用户可以对网络设备进行响应 以便执行任务或者实现目标。服务可以由网络服务器或者其他网络设 备提供,或者甚至可以由移动终端提供,诸如移动电话、移动电视、 移动游戏系统等等。
在很多应用中,需要用户从网络接收音频信息,诸如口头反馈或 者指令。这种应用的例子可以是支付账单、定购程序、接收驾驶指令 等等。此外,在诸如音频书的一些服务中,应用例如几乎完全基于接 收音频信息。由计算机生成的声音来提供这样的音频信息正在变得日 益通便。因此,在使用这种应用中的用户体验将极大地依赖于计算机 生成的声音的质量和自然性。因此,进行了很多研究和开发来改进计 算机生成的声音的质量和自然性。
所关注的这种计算机生成的声音的一个特定应用被公知为文本 转语音(TTS)。TTS是根据计算机可读文本来创建可听的语音。通 常认为TTS包括两个阶段。首先,计算机检查将要被转换成可听语音 的文本,以确定文本应如何发音、重读哪些音节、使用什么音高、以 多快的速度递送语音等的规范。接下来,计算机试图创建与该规范匹 配的音频。
随着用于通过TTS来递送听起来自然的、高质量语音的改进手段 的发展,出现了在接收TTS输出时进一步增强用户体验的期望。因此, 改进用户体验的一种方式是通过熟悉的或者预期的声音来递送TTS 输出。例如,用户可能希望听到以他或者她自己的声音或者其他预期 的目标声音、而不是TTS输出的源声音来递送的TTS输出。语音到 某些目标语音的转换是特征变换的一个示例。
为了提供改进的特征变换,已经发现,基于高斯混合模型(GMM) 的技术在可表示为标量或者矢量的特征的变换中是有效的。在基于 GMM的变换中,使用源矢量和目标矢量的集合来估计联合密度的 GMM参数。由此,可以创建基于GMM的转换函数。例如,可以使 用包括源矢量和目标矢量的采样的一组训练数据来训练变换模型。一 旦经过训练,则变换模型可以用来产生给定输入源矢量的经过变换的 矢量。由于期望将经过变换的矢量和目标矢量之间的均方差(MSE) 最小化,使用一组测试数据或者验证数据来对经过变换的矢量和目标 矢量进行比较。然而,为了具有高效的变换,常常需要包括大量的训 练数据和测试数据二者。例如,数据库可以包含对应于相对较大数量 的采样语句的源语音和目标语音,其中,60%的采样用于训练数据, 而40%的采样用于测试数据。因此,可能增加资源(诸如存储器和功 率)的消耗。
特别是在移动环境中,存储器和功率消耗的增加直接影响使用这 些方法的设备的大小和成本。然而,即使在非移动环境中,这样的方 法可能导致用于训练或者测试模型的算法的长的处理时间。由此,需 要提供可以有效应用的、充分质量的特征变换。
发明内容
因此,提供了一种用于在特征变换中提供有效评估的方法、装置 和计算机程序产品。具体地,提供了一种GMM评估方法、装置和计 算机程序产品,其通过在变换模型的训练期间提供用于评估变换模型 质量、并由此评估变换模型的变换性能的机制,来消除任何对测试数 据或者验证数据的需求。因此,可以减少或者消除测试数据或者验证 数据,并且还可以减少相应的资源消耗。
在一个示例性实施方式中,提供了一种在特征变换中提供有效评 估的方法。该方法包括:使用训练源数据和训练目标数据来训练高斯 混合模型(GMM);响应于该训练,产生转换函数;以及通过计算 GMM的迹测量,在使用该转换函数之前确定该转换函数的质量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚公司,未经诺基亚公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780015664.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:导电颗粒配置薄片及各向异性导电膜
- 下一篇:试料导入系统