[发明专利]一种错误自感知的声调发音学习方法和系统有效

申请号：	200910186154.3	申请日：	2009-09-29
公开（公告）号：	CN101661675A	公开（公告）日：	2010-03-03
发明（设计）人：	俞凯;王欢良	申请（专利权）人：	苏州思必驰信息科技有限公司
主分类号：	G09B7/04	分类号：	G09B7/04;G10L13/00;G10L15/00
代理公司：	苏州创元专利商标事务所有限公司	代理人：	范晴
地址：	215123江苏省苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种错误感知声调发音学习方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及计算机语音信号处理领域，尤其涉及在计算机辅助的口语语言学习中，通过改进的反馈机制实现错误自感知的声调发音辅助学习的方法和系统。

背景技术

声调是有调语言(如汉语和泰语)的重要组成部分，具有辨词表意和传达情感的作用。如果声调发音不准，那么会导致语言交流的困难。因此，声调通常是衡量口语语言能力的重要指标。对于非母语学习者来说，声调发音是有调语言的口语学习中的最大障碍之一。

计算机辅助的口语学习为语言学习提供了一个有效的途径，并且现在已被越来越多的学习者所接受。计算机辅助的口语学习最重要的一个特征就是交互能力，即能够为学习者提供有价值的反馈信息，包括发音评价和发音指导。

已公开的专利文献，如公开号为CN101383103和CN1815522的专利等，都涉及了对声调发音进行评估和指导的方法，但这类方法对声调发音的指导方式主要是首先总结声调发音规则，然后根据声调发音错误给出确定的改进建议。这种预先设定好的指导建议有三个局限性：一、指导建议是抽象的，不同学习者对建议的理解不同；二、声调主要由声带振动频率产生，难以主观直接控制；三、建议的普适性和具体性(针对不同的学习者和学习内容) 是矛盾的，因此学习者从指导建议中得到的帮助非常有限。除了发音指导建议之外，这些系统也能提供标准声调发音，但对这种发音对用户来说可能是陌生的，有时和用户的声音相差甚远，用户难以准确模仿。

已公开专利CN101315733中涉及了声调的识别和后验概率计算。为了进行声调识别，它在语音识别系统基础上进行语音数据的声韵母切分和限制声韵母边界的声调的识别；根据切分和限制边界识别的结果计算声调后验概率。这种方法的局限性就是：一、声调识别和后验概率计算严重依赖于声韵母边界，如果学习者发音不准，语音识别得到的声韵母边界就不可靠，这对于非母语学习者尤其显著；二、对于多音节连续语音的声调发音学习来说，声韵母边界的准确确定比较困难，尤其是自然口语的声调发音学习。

已公开的涉及声调发音学习的现有技术，反馈方式单一，指导信息抽象，还有如下不足：一、难以支持对连续语音的声调进行准确评分，这是一项重要的功能缺失；二、对于非母语学习者来说，来自计算机的错误提示和改进建议是教条的，难以提供感性认识，会导致对建议的理解偏差，而对于改进没有量化感觉。

现有的声调发音学习系统所能提供的反馈信息是抽象的，不丰富的，难以错误自感知的。对学习者来说，标准声调的发音示例是陌生的，难以和其实际发音进行对比来发现声调错误，并且也是难以模仿的。在声调曲线绘制方面，标准4声调曲线过于简单，携带的指导信息有限，难以反映实际声调发音质量；而绘制实际声调的基频轨迹又过于粗糙、复杂，学习者难以发现确切的发音错误和指导。现有声调发音学习系统对学习者来说难以启发式地诱导用户进行学习，可能导致学习者一味模仿标准的发音而无法从与该系统的互动中在感性上得到准确、直观、丰富的指导信息，其性能是不完善的。因此，开发一种具有立体的全方位的错误反馈能力的声调发音学习方法和系统是非常必要的，可以提供形象、直观、娱乐的反馈信息，具有错误自感知能力。

发明内容

本发明要解决的技术问题是：提供一种具有错误自感知功能的声调发音学习方法和系统，具有综合的、立体的学习反馈机制，能为学习者提供准确、形象、直观、娱乐的反馈信息，使学习者更容易发现自己声调发音上的问题，帮助学习者学习语音声调，提高学习者声调发音的学习效率。通过声音和图像两种方式来反馈学习者的声调发音质量，得到的反馈语音和现有技术相比更贴合学习者的语音，绘制的声调曲线更形象直观地反映错误程度，发音评价得分更准确，给学习者一个更有利于其学习改进的发音参考，使得学习者可以明确感知自己的声调发音错误和正确的声调发音，从而启发式地引导学习者有目标地校正自己的声调发音。

本发明的技术方案是：一种错误自感知的声调发音学习方法，包括如下步骤：

步骤S1：首先建立标准发音语音库，训练声调模型和音素模型，得到标准上下文相关的三元声调模型和语谱音素模型；

步骤S2：从学习者的语音中提取声学特征，包括语音频谱特征和声调特征，并对声调特征进行后处理；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司，未经苏州思必驰信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200910186154.3/2.html，转载请声明来源钻瓜专利网。

上一篇：酰乙基苯基次膦酰肼或其金属盐以及其制备方法
下一篇：电池系统

同类专利

专利分类

G 物理

G09 教育；密码术；显示；广告；印鉴
G09B 教育或演示用具；用于教学或与盲人、聋人或哑人通信的用具；模型；天象仪；地球仪；地图；图表
G09B7-00 以问答方式工作的电操作的教具或设备
G09B7-02 .对提出的问题要求学生构思答案或者学生提出问题由机器给予答案的形式
G09B7-06 .多个选择答案式，即对提出的一个问题给予一系列的答案，并从中选出一答案
G09B7-07 ..对多个学习
G09B7-08 ..能按错误答案来修改教学程序为特点的，例如重复提出问题，提供进一步信息
G09B7-10 ..其中一组答案通用于多个问题的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种错误自感知的声调发音学习方法和系统有效

专利文献下载