[发明专利]一种基于先验知识的发音评估与诊断系统有效
申请号: | 200810226675.2 | 申请日: | 2008-11-19 |
公开(公告)号: | CN101739869A | 公开(公告)日: | 2010-06-16 |
发明(设计)人: | 徐波;徐爽;江杰;陈振标;浦剑涛 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G09B19/06 | 分类号: | G09B19/06;G09B7/00;G09B7/02;G10L15/28;G10L15/02 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周国城 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 先验 知识 发音 评估 诊断 系统 | ||
技术领域
本发明涉及计算机辅助语言学习和语音处理技术领域,特别是一种基 于先验知识的发音评估与诊断系统。
背景技术
我国传统的普通话学习和测试方法,目前正面临着普通话推广的迫切 需求与学习和测试条件不足的突出矛盾。普通话学习需要针对学生个别的 问题进行纠正,需要长时间的互动式交流,这些条件以目前的师资是无法 满足的。同时,口语考试是检验学习成果的有效手段,但耗时耗力的人力 组织,不可避免的公正性问题以及很难提供反馈信息等因素已成为制约普 通话口语考试发展的瓶颈。要解决以上问题,计算机辅助语言学习和测试 是个可行的方案。随着计算机技术和语音识别技术的发展,计算机语言学 习和测试系统已经从最初的只能进行听力、阅读、书写等功能发展到对语 言学习者的发音水平进行自动评分、指出发音错误并根据发音错误提供诊 断信息,从而对学习者的发音水平进行全方位测试并帮助学习者改进发 音,提高学习效率。因此,作为新一代计算机辅助语言学习和测试系统的 核心部分,自动发音评估和诊断技术日益受到关注。
目前的自动发音评估和诊断技术是基于统计语音识别框架下的发音 评估和检错策略。它首先对输入语音进行音素分割,对分割得到的每一个 音素,计算对数后验概率或其简化形式作为发音特征,进行发音质量评估, 针对学习者的发音水平给出相应的得分,并采用统一门限进行错误检测。
上述方法所面临的问题是:首先,发音评估和诊断的准确性不是很高, 特别是对一些在实际发音中经常犯错的、发音又很接近的易混淆音素对。 其次,只能针对学习者的发音水平高低给出相应的得分,无法给出更有指 导意义的诊断信息。为解决以上问题,本发明构建一个基于先验知识的发 音评估与诊断系统,该系统不仅可以对学习者的发音给出分数,而且可以 给出更为细致的诊断信息。
发明内容
(一)要解决的技术问题
有鉴于此,本发明的主要目的在于针对现有发音评估和诊断方法的缺 点,引入语言学和普通话教学中的先验专家知识,提供一种基于先验知识 的发音评估与诊断系统,以提高语言学习和测试的效率和效果。
(二)技术方案
为达到上述目的,本发明采用的技术方案如下:
一种基于先验知识的发音评估与诊断系统,该系统包括:
语音预处理单元,用于对学习者输入的原始语音进行预处理,以实现 对语音基本内容的确认,将内容基本符合标准脚本的语音分割为音素级的 小单元,输入到发音评估单元进行判别;
发音评估单元,用于对输入的语音进行初步发音质量评估,利用易混 淆音素对的发音错误先验知识对传统后验概率进行修正,基于修正后的后 验概率进行发音评估,计算出的后验概率通过映射模型可以转换为直观的 衡量发音水平的分数或等级;
发音评估确认和诊断单元,用于对发音评估单元输入的初步评估结 果,利用易混淆音素对的区别性特征的先验知识,采用基于区别性特征及 分类器的方法,进行发音评估结果的确认,并从声学语音学角度提供发音 诊断信息;
模型和先验知识库单元,用于保存音素对齐和计算后验概率的模型, 以及先验知识库;以及
评估信息和诊断信息输出单元,用于输出包括分级和打分结果的发音 评估的分数、发音错误的定位信息、发音错误类型,并给出矫正的指导性 建议。
上述方案中,所述语音预处理单元包括:
端点检测子单元,用于从信号中区分出语音和非语音信号,确定语音 的起点和终点;
特征提取子单元,用于计算有效语音的声学参数,并进行特征的计算, 提取出反映信号特征的关键特征参数;
内容确认子单元,用于对输入的语音进行内容方面的验证,如果输入 发音的内容与给定文本内容差异不大,则对语音进行后续的发音评估和诊 断;对于内容和给定文本差异很大的语音,不再进行后续发音评估和诊断, 直接判断为用户发音错误;
音素对齐子单元,用于将输入的有效语音分割成音素级的单元,以便 后续的处理。
上述方案中,所述反映信号特征的关键特征参数是反映人耳听觉特征 的Mel频率倒谱系数MFCC,包含由12维倒谱值加上1维能量值构成的 静态特征,以及该静态特征的一阶动态特征和二阶动态特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810226675.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:稻田水位显示装置
- 下一篇:液体箱无极水位检测电路