[发明专利]发音检错方法、装置、电子设备及存储介质有效
申请号: | 201910266444.2 | 申请日: | 2019-04-03 |
公开(公告)号: | CN109979484B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 曾慧;徐燃;雷宇 | 申请(专利权)人: | 北京儒博科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L15/04;G10L15/26 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 101500 北京市密云区经济开发*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发音 检错 方法 装置 电子设备 存储 介质 | ||
本发明实施例公开了一种发音检错方法、装置、电子设备及存储介质,其中方法包括:基于预设拆分规则对目标词句进行拆分处理,得到所述目标词句的不同时长的发音单元;将用户朗读目标词句的音频数据和所述不同时长的发音单元进行对齐处理,确定所述不同时长的发音单元各自对应的音频片段;计算所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频之间的相似度;依据相似度计算结果,判断用户的错误发音单元。本发明实施例实现了在多个级别进行发音检错,提高了定位用户错误发音单元的准确性。
技术领域
本发明实施例涉及语音识别技术领域,尤其涉及一种发音检错方法、装置、电子设备及存储介质。
背景技术
在英文学习的过程中,口语练习,需要时常纠正发音,在这一过程中,需要正确评价每个音节甚至每个元音,辅音的发音。
目前,在英文发音评测系统中,用户待输入的语音数据所对应的文本是已知的,系统得到音频后,将录入音频和相应文本进行强制对齐,以确定文本的每个音素(即单个音标)对应的音频片段,并将各音频片段与标准音素集进行似然计算,根据各音素的似然得分直接确定每个音素的发音效果。
然而,现有的英文发音评测系统仍存在一定的不足:在强制对齐过程中,每个音素的持续时间短,且在时序上受前后发音影响,只根据某个音素的评分直接确定该音素的发音质量是不准确的。
发明内容
本发明实施例提供了一种发音检错方法、装置、电子设备及存储介质,以解决现有技术中存在的,仅根据单个音素的评分直接判定该音素发音质量时,判定准确性低的技术问题。
第一方面,本发明实施例提供了一种发音检错方法,包括:
基于预设拆分规则对目标词句进行拆分处理,得到所述目标词句的不同时长的发音单元;
将用户朗读目标词句的音频数据和所述不同时长的发音单元进行对齐处理,确定所述不同时长的发音单元各自对应的音频片段;
计算所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频之间的相似度;
依据相似度计算结果,判断用户的错误发音单元。
第二方面,本发明实施例还提供了一种发音检错装置,包括:
拆分模块,用于基于预设拆分规则对目标词句进行拆分处理,得到所述目标词句的不同时长的发音单元;
对齐处理模块,用于将用户朗读目标词句的音频数据和所述不同时长的发音单元进行对齐处理,确定所述不同时长的发音单元各自对应的音频片段;
相似度计算模块,用于计算所述不同时长的发音单元各自对应的音频片段与所述不同时长的发音单元的标准音频之间的相似度;
检错模块,用于依据相似度计算结果,判断用户的错误发音单元。
第三方面,本发明实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任一实施例所述的发音检错方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任一实施例所述的发音检错方法。
本发明实施例提供了一种发音检错方法、装置、电子设备及存储介质,通过预设拆分规则将目标词句拆成不同时长的发音单元,并计算不同时长的发音单元各自对应的标准音和用户发音之间的相似度,并根据相似度结果确定错误发音单元。由此实现了在多个级别进行发音检错,提高了定位用户错误发音单元的准确性。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京儒博科技有限公司,未经北京儒博科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910266444.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:音频信号的旋律检测方法、装置以及电子设备
- 下一篇:音频评价方法和装置