[发明专利]一种汉语普通话中平舌音和卷舌音的客观测试方法无效
申请号: | 200810102580.X | 申请日: | 2008-03-24 |
公开(公告)号: | CN101546553A | 公开(公告)日: | 2009-09-30 |
发明(设计)人: | 颜永红;董滨;杨军 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10L11/00 | 分类号: | G10L11/00 |
代理公司: | 北京泛华伟业知识产权代理有限公司 | 代理人: | 王 勇 |
地址: | 100190北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汉语 普通话 中平 卷舌音 客观 测试 方法 | ||
技术领域
本发明涉及汉语普通话客观测试技术领域,具体地说,本发明涉及一种汉语普通话中平舌音和卷舌音的客观测试方法。
背景技术
在汉语普通话的学习中,由于声母的发音持续时间比较短,发音过程包括成阻、持阻和除阻三个阶段,对发音部位和发音方法的要求较高,所以,声母的发音难度较大,特别是一些发音方法和发音部位比较接近的声母,学习者由于受到自身母语和地方语的影响,在普通话的学习过程中容易混淆。
一般来说,学习者在学习第二语言的过程中,总是习惯于用母语中的发音来模拟第二语言中的发音。如果母语中的发音可以和第二语言中的某些发音对应,那么这些发音一般比较容易掌握,而且掌握的比较好。但是,如果第二语言中的某些音在学习者的母语中找不到可以对应的音,那么,这些音的学习难度将特别大。特别是,如果在第二语言中有些发音十分接近的音,而在学习者的母语中这些音本身就是不区分的,那么在这种情况下,学习者就更加难以掌握了。
平舌音和卷舌音,是普通话中比较难学习和掌握的两类声母,特别是对于母语是南方语系的学习者和测试者,由于母语的原因,更不容易区分。在汉语普通话中,共有六个平舌音和卷舌音,分别是[s]、[sh]、[c]、[ch]、[z]和[zh];其中,[s]、[z]和[c]属于平舌音,[sh]、[zh]和[ch]属于卷舌音。
目前,基于隐马尔可夫的汉语普通话测试方法是应用较广的一种方法。输入语音首先通过识别器被一遍解码,在这个过程中,对应于输入语音的词图或词序列被得到。第二遍计算过程在前面得到的词图或词序列的基础上进行,计算输入语音与声学模型的匹配程度,最后通过映射得到输入语音的得分。由于目前使用的声学模型中平舌音和卷舌音的鉴别度不高,导致输入语音通过解码后计算的与声学模型的匹配程度准确度不高,辅助学习者学习时效果较差。
发明内容
为克服现有技术中平舌音和卷舌音的测试准确性差的缺陷,本发明提出一种汉语普通话中平舌音和卷舌音的客观测试方法。
根据本发明的一个方面,提供了一种汉语普通话中平舌音和卷舌音的客观评测方法,包括:
步骤10)、对输入语音进行切分;
步骤20)、提取切分后语音的能量均值比特征;
步骤30)、将所述能量均值比与通过训练获取的阈值比较,得到客观评测平舌音和卷舌音的得分。
其中,步骤10)中,优选地,以音素为最小单位对输入语音进行切分。
其中,步骤20)中,优选地,所述语音区别特征为输入语音的强频集中区和非强频集中区的能量均值比。
其中,步骤20)进一步包括:
步骤100)、分析切分后语音的频谱特征,去除低频能量集中区;
步骤200)、定位所述语音的强频集中区,获取所述强频集中区的能量均值;
步骤300)、定位所述语音的非强频集中区,获取所述语音非强频集中区的能量均值;
步骤400)、获取所述语音的所述强频集中区和所述非强频集中区的能量均值比。
其中,步骤30)进一步包括:如果输入语音应该为平舌音,当输入语音的能量均值比大于预设的阈值,将输入语音测定为平舌音;如果输入语音应该为卷舌音,当输入语音的能量均值比大于预设的阈值,将输入语音测定为卷舌音。
其中,步骤100)进一步包括:
步骤110)、对语音信号分帧,获取每一频率点上的频域能量;
步骤120)、使用滑动窗,确定频域能量的极大值点;
步骤130)、采用可变窗,确定低频高能量区域的频率上限点,去除低于所述频率上限点的各频率点。
其中,步骤200)进一步包括:
步骤210)、通过设定平舌音强频集中区的频率下限和卷舌音强频集中区的频率上限,设定平舌音和卷舌音的强频集中区的范围;
步骤220)、使用滑动窗,在所述设定的强频集中区范围内寻找能量极值点;
步骤230)、对于平舌音,将所述频率下限到能量极值点之间的区域作为强频集中区;对于卷舌音,将能量极值点到所述频率上限之间的区域作为强频集中区;
步骤240)、将寻找能量极值点时滑动窗中各频点的能量均值作为所述强频集中区的能量均值。
其中,步骤300)进一步包括:
步骤310)、通过计算能量极小值,确定平舌音非强频集中区的频率上限;
步骤320)、通过计算能量极大值,确定卷舌音非强频集中区的频率下限;
步骤330)、计算输入语音非强频集中区能量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810102580.X/2.html,转载请声明来源钻瓜专利网。