[发明专利]语音分级测定方法及系统有效
申请号: | 200810104182.1 | 申请日: | 2008-04-16 |
公开(公告)号: | CN101562012A | 公开(公告)日: | 2009-10-21 |
发明(设计)人: | 许军;张化云;陈炜;李慧勤 | 申请(专利权)人: | 创而新(中国)科技有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/08;G10L15/14;G10L15/02;G10L15/06 |
代理公司: | 北京同立钧成知识产权代理有限公司 | 代理人: | 刘 芳 |
地址: | 100089*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 分级 测定 方法 系统 | ||
技术领域
本发明涉及语音识别领域,特别是涉及一种语音分级测定方法及系统。
背景技术
语音识别的本质是对语音信号进行分类。传统语音识别建模的重点在于捕捉不同发言人在不同场合中相同内容发音之间的共性。目前,较为成熟的语音识别建模是基于状态概率分布密度的隐马尔可夫模型(Hidden MarkovModel,以下简称HMM)。基于HMM模型的语音识别中,计算置信度常用的方法是对数似然法(Log Likelihood Ratio,简称LLR),
1、不能识别语言学习者发音的细微差别。语言学习与语音识别最大的区别在于,语言学习中语音测定目标更为关注语言学习者发音的细节特征。目前基于HMM模型的对数似然法中,反模型的参数缺乏有效的确定方法,而是采用一些近似的算法,例如:最大似然准则(Maximum LikelihoodPrinciple,简称MLP),对反模型的参数进行估计。因此采用对数似然法不能够区分一段语音中的个别发音错误,即传统语音识别不能区分的发音,对数似然法也无法区分。
2、采用该方法进行语音识别往往需要提供海量的训练数据。HMM模型利用最大似然准则来估计状态的输出概率分布密度,从而实现语音的识别。但在语言学习中,大量采集语音专家的标准发音需要较高成本,即采集海量的训练数据存在困难。
总之,由于语音识别与语言学习中语音测定目标不同,基于HMM模型的对数似然法存在语音分级判决复杂度高、语音分级测定准确度低等缺陷。
发明内容
本发明要解决的技术问题是提供一种语音分级测定方法及系统,用以降低语音分级判决的复杂度,提高语音分级测定的准确性。
为解决上述技术问题,本发明第一方面通过一些实施例提供了一种语音分级测定方法,包括以下步骤:
将接收到的语音信号进行语音识别,根据参考文本对接收的语音信号提取语音特征,并根据参考模型采用维特比算法对所述语音特征进行维特比状态对齐,获取状态对齐的语音特征序列;所述参考模型为隐马尔可夫模型;
根据状态对齐的语音特征序列,对各状态相应的所述参考模型分布参数进行最大后验概率修正;将修正后的所述隐马尔可夫模型中所有均值矢量顺序连接,获得所述语音信号相对于所述隐马尔可夫模型的语音模板矢量;
利用支持向量机分类判决树对所述语音模板矢量进行分类判决,获得所述语音模板矢量映射的分类等级。
本发明第一方面实施例提供的语音分级测定方法中,将采用支持向量机对语言分类边界进行建模并引入语言学习应用中,对接收的语音信号提取语音特征序列,与参考模型进行状态对齐,修正参考模型分布参数并生成相应的语音模板矢量,利用支持向量机分类判决树对语音模板矢量进行判决,有效降低了语音分类判决的复杂度,提高语音分级测定的准确性。
为解决上述技术问题,本发明第二方面通过另一些实施例提供了一种语音分级测定系统,包括:
模型库,用于存储参考文本和参考模型;
语音识别模块,将接收到的语音信号进行语音识别,根据参考文本和参考模型获取状态对齐的语音特征序列;
模板矢量生成模块,用于根据状态对齐的语音特征序列对参考模型分布参数进行修正,生成所述语音信号基于该参考模型的语音模板矢量;
判决模块,用于利用支持向量机分类判决树对所述语音模板矢量进行分 类判决,获得所述语音模板矢量映射的分类等级;所述模板矢量生成模块,包括:修正单元,用于根据状态对齐的语音特征序列,分别对各状态下隐马尔可夫模型的分布参数进行最大后验概率修正;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创而新(中国)科技有限公司,未经创而新(中国)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810104182.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实现移动定位业务的系统和方法
- 下一篇:数字照片的局部颜色迁移方法