[发明专利]发音质量评估系统中的置信度快速求取方法有效
申请号: | 200810240811.3 | 申请日: | 2008-12-23 |
公开(公告)号: | CN101645271A | 公开(公告)日: | 2010-02-10 |
发明(设计)人: | 董滨;葛凤培;颜永红 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L15/02 |
代理公司: | 北京法思腾知识产权代理有限公司 | 代理人: | 杨小蓉 |
地址: | 100190北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发音 质量 评估 系统 中的 置信 快速 求取 方法 | ||
1.一种发音质量评估系统中的置信度快速求取方法,其特征在于,包括如下步 骤:
1)将待识别语音输入语音识别系统中;
2)对输入语音进行预处理,该预处理中包括分帧处理;
3)采用感知加权线性预测参数特征提取方法或者美尔域倒谱系数特征提取方法 提取语音特征;
4)利用全音节循环网络状态图和精细声学模型,对特征向量序列进行解码,得 到最优路径,记录最优路径上的各音素分割点信息;
5)按照步骤4)中得到的音素分割点,根据精细声学模型和对应帧的特征向量, 对目标音素和语音帧做强制对齐处理,获得每一帧语音对应的状态号,并计算各帧 语音对应其相应状态的似然概率值p(xt|st),其负对数为:
其中,xt为输入的第t帧语音特征,st为第t帧语音特征对应的隐马尔科夫模型 的状态,该状态为正态分布N(μt,∑t),μt和∑t分别是状态st模型的均值矢量和协 方差矩阵,n是特征向量的维数;
6)引入粗略的背景模型,计算每帧语音在该模型包含的所有状态下的似然概率 和其中,D*是粗略背景模型中所有状态的集合;
7)计算每一帧待评估语音的广义后验概率:
8)分别计算每个音素的广义后验概率:
其中,τs、τe分别指输入的语音特征在当前音素的起始帧号和结束帧号,st是 从强制对齐结果中获得的对应于第t帧语音特征xt的状态号;
9)将音素的广义后验概率作为该音素在发音质量评估系统中的置信度得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810240811.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动交换光网络保护的分布式配置方法
- 下一篇:一种治疗寻常型银屑病的药剂