[发明专利]一种发音检错方法及装置有效
申请号: | 201410609649.3 | 申请日: | 2014-10-31 |
公开(公告)号: | CN105632515B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 赵超;高前勇;魏思;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/78 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 郭少晶;逢京喜 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 发音 检错 方法 装置 | ||
本发明公开了一种发音检错方法及装置,该方法包括:获取待检错语音信号;提取所述语音信号的语音特征序列;对所述语音特征序列进行切分,获取基本语音单元片断;对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分;根据所述基本语音单元片断的发音得分进行发音检错。本发明能够减小发音得分出现的偏差,提高发音检错的准确率。
技术领域
本申请涉及发音检错技术领域,尤其涉及一种发音检错方法及装置。
背景技术
自上世纪90年代开始,为了解除传统方法的束缚,越来越多的语音识别、语言学、教育学等方面的研究人员开展计算机辅助发音训练(Computer Assisted PronunciationTraining,CAPT)系统的研究与开发,用于取代或者部分取代“教师”的作用,实现对学习者发音水平的自动评估,并对发音错误给予反馈与指导,提高学习效果与效率。
发音检错即检测出用户发音过程中的错误,作为CAPT系统的重要环节,受到很多研究人员的关注。现有发音检错系统中,发音得分通常计算为语音单元片断相应于其对应系统预设模型的相似度,系统预设模型由系统预先在采集的语音数据上训练得到。然而,由于训练数据的有限性,训练数据中包含的基本语音单元的词频分布往往具有一定的偏向性,如常用单词not、and等往往出现频率较高,而较生僻的单词则出现频率较低。而在真实数据测试中,由于测试数据环境和训练数据的不尽一致,数据充足的模型识别率高,而那些数据稀疏的模型识别可能出现失真。相应的,基于该模型打分的发音得分可能存在一定的偏差,从而导致发音检测的准确率不高。
发明内容
为解决上述技术问题,本申请实施例提供一种发音检错方法及装置,能够减小发音得分出现的偏差,提高发音检错的准确率。技术方案如下:
一种发音检错方法,包括:
获取待检错语音信号;
提取所述语音信号的语音特征序列;
对所述语音特征序列进行切分,获取基本语音单元片断;
对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分;
根据所述基本语音单元片断的发音得分进行发音检错。
优选地,所述对所述基本语音单元片断进行模型得分补偿,获得所述基本语音单元片断的发音得分,包括:
确定所述基本语音单元片断对应的发音模型和竞争模型;
计算所述基本语音单元片断与所述发音模型的第一似然度得分,以及所述基本语音单元片断与所述竞争模型的第二似然度得分;
获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数;
根据所述模型补偿系数对其对应的所述第二似然度得分进行补偿,获得第三似然度得分;
根据所述竞争模型对应的所述第三似然度得分及所述第一似然度得分获得所述基本语音单元片断的发音得分。
优选地,所述获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数,包括:
获取训练数据;
获取所述训练数据中的基本语音单元片断;
确定所述基本语音单元片断对应的发音模型及竞争模型;
计算所述基本语音单元片断的第一似然度得分集合及第二似然度得分集合;其中,所述第一似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述发音模型的似然度得分形成的集合;所述第二似然度得分集合为由所有所述训练数据中的基本语音单元片断与所述竞争模型的似然度得分形成的集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410609649.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种融合业务系统及其业务实现方法
- 下一篇:信息隐藏方法及系统