[发明专利]发音检错方法、装置、电子设备及存储介质有效

申请号：	201910266444.2	申请日：	2019-04-03
公开（公告）号：	CN109979484B	公开（公告）日：	2021-06-08
发明（设计）人：	曾慧;徐燃;雷宇	申请（专利权）人：	北京儒博科技有限公司
主分类号：	G10L25/51	分类号：	G10L25/51;G10L15/04;G10L15/26
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	101500 北京市密云区经济开发***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	发音检错方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种发音检错方法、装置、电子设备及存储介质，其中方法包括：基于预设拆分规则对目标词句进行拆分处理，得到所述目标词句的不同时长的发音单元；将用户朗读目标词句的音频数据和所述不同时长的发音单元进行对齐处理，确定所述不同时长的发音单元各自对应的音频片段；计算所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频之间的相似度；依据相似度计算结果，判断用户的错误发音单元。本发明实施例实现了在多个级别进行发音检错，提高了定位用户错误发音单元的准确性。

技术领域

本发明实施例涉及语音识别技术领域，尤其涉及一种发音检错方法、装置、电子设备及存储介质。

背景技术

在英文学习的过程中，口语练习，需要时常纠正发音，在这一过程中，需要正确评价每个音节甚至每个元音，辅音的发音。

目前，在英文发音评测系统中，用户待输入的语音数据所对应的文本是已知的，系统得到音频后，将录入音频和相应文本进行强制对齐，以确定文本的每个音素(即单个音标)对应的音频片段，并将各音频片段与标准音素集进行似然计算，根据各音素的似然得分直接确定每个音素的发音效果。

然而，现有的英文发音评测系统仍存在一定的不足：在强制对齐过程中，每个音素的持续时间短，且在时序上受前后发音影响，只根据某个音素的评分直接确定该音素的发音质量是不准确的。

发明内容

本发明实施例提供了一种发音检错方法、装置、电子设备及存储介质，以解决现有技术中存在的，仅根据单个音素的评分直接判定该音素发音质量时，判定准确性低的技术问题。

第一方面，本发明实施例提供了一种发音检错方法，包括：

基于预设拆分规则对目标词句进行拆分处理，得到所述目标词句的不同时长的发音单元；

将用户朗读目标词句的音频数据和所述不同时长的发音单元进行对齐处理，确定所述不同时长的发音单元各自对应的音频片段；

计算所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频之间的相似度；