[发明专利]一种发音检错方法及装置有效

申请号：	201410609649.3	申请日：	2014-10-31
公开（公告）号：	CN105632515B	公开（公告）日：	2019-10-18
发明（设计）人：	赵超;高前勇;魏思;胡国平;胡郁;刘庆峰	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L25/03	分类号：	G10L25/03;G10L25/78
代理公司：	北京维澳专利代理有限公司 11252	代理人：	郭少晶;逢京喜
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种发音检错方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种发音检错方法及装置，该方法包括：获取待检错语音信号；提取所述语音信号的语音特征序列；对所述语音特征序列进行切分，获取基本语音单元片断；对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分；根据所述基本语音单元片断的发音得分进行发音检错。本发明能够减小发音得分出现的偏差，提高发音检错的准确率。

技术领域

本申请涉及发音检错技术领域，尤其涉及一种发音检错方法及装置。

背景技术

自上世纪90年代开始，为了解除传统方法的束缚，越来越多的语音识别、语言学、教育学等方面的研究人员开展计算机辅助发音训练(Computer Assisted PronunciationTraining，CAPT)系统的研究与开发，用于取代或者部分取代“教师”的作用，实现对学习者发音水平的自动评估，并对发音错误给予反馈与指导，提高学习效果与效率。

发音检错即检测出用户发音过程中的错误，作为CAPT系统的重要环节，受到很多研究人员的关注。现有发音检错系统中，发音得分通常计算为语音单元片断相应于其对应系统预设模型的相似度，系统预设模型由系统预先在采集的语音数据上训练得到。然而，由于训练数据的有限性，训练数据中包含的基本语音单元的词频分布往往具有一定的偏向性，如常用单词not、and等往往出现频率较高，而较生僻的单词则出现频率较低。而在真实数据测试中，由于测试数据环境和训练数据的不尽一致，数据充足的模型识别率高，而那些数据稀疏的模型识别可能出现失真。相应的，基于该模型打分的发音得分可能存在一定的偏差，从而导致发音检测的准确率不高。

发明内容

为解决上述技术问题，本申请实施例提供一种发音检错方法及装置，能够减小发音得分出现的偏差，提高发音检错的准确率。技术方案如下：

一种发音检错方法，包括：

获取待检错语音信号；

提取所述语音信号的语音特征序列；

对所述语音特征序列进行切分，获取基本语音单元片断；

对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分；

根据所述基本语音单元片断的发音得分进行发音检错。

优选地，所述对所述基本语音单元片断进行模型得分补偿，获得所述基本语音单元片断的发音得分，包括：

确定所述基本语音单元片断对应的发音模型和竞争模型；

计算所述基本语音单元片断与所述发音模型的第一似然度得分，以及所述基本语音单元片断与所述竞争模型的第二似然度得分；

获得所述基本语音单元片断对应的所述竞争模型的模型补偿系数；