[发明专利]一种语音识别发音错误的纠正方法及系统有效
申请号: | 201811239934.5 | 申请日: | 2018-10-23 |
公开(公告)号: | CN109461436B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/02;G10L15/06;G10L15/10;G10L25/60 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 发音 错误 纠正 方法 系统 | ||
本发明提供了一种语音识别发音错误的纠正方法及系统,其方法包括:建立发音易错字对应的标准声学模型和错误声学模型之间的映射表;获取用户语音信息;识别所述用户语音信息,当所述语音信息中包含所述发音易错字时,提取所述用户语音信息中包含所述发音易错字的词语对应的音频片段;当所述音频片段与所述错误声学模型中的语音音频匹配结果为相符时,提示用户所述发音易错字发音错误,并根据所述映射表输出对应的所述标准声学模型中的语音音频。本发明通过建立标准声学模型和错误声学模型之间的映射表,在识别出用户发音易错字发音错误时进行提示并输出相应的正确音频。
技术领域
本发明涉及语音识别技术领域,尤指一种语音识别发音错误的纠正方法及系统。
背景技术
随着互联网的快速发展,人们的生活变得越来越智能化。语音交互作为智能终端中人机交互主流的交流应用之一,也是越来越受到用户的青睐。智能终端基于用户输入的语音采取相应的措施,因此用户通过终端终端所输入的语音的准确性严重影响着智能终端所作出的反馈。
汉字中存在大量的多音字、形近字等,对于部分用户而言,很难分清楚不常用较生僻的多音字、形近字,更有甚者,对于部分多音字、形近字有的用户的常用发音本身就是错误的。
另外对于小学生而言,他们还在学习的过程中,特别是识字量不多的情况下,经常出现含多音字的词语读错或形近字读错的情况,这种情况在智能终端识别读音时,会导致识别错误,无法给出需要查询的正确结果或者相应的准确的反馈。因此,需要一种语音识别发音错误的纠正方法及系统解决上述问题。
发明内容
本发明的目的是提供一种语音识别发音错误的纠正方法及系统,实现通过建立标准声学模型和错误声学模型之间的映射表,在识别出用户发音易错字发音错误时进行提示并输出相应的正确音频。
本发明提供的技术方案如下:
本发明提供一种语音识别发音错误的纠正方法,其特征在于,包括:
建立发音易错字对应的标准声学模型和错误声学模型之间的映射表;
获取用户语音信息;
识别所述用户语音信息,当所述语音信息中包含所述发音易错字时,提取所述用户语音信息中包含所述发音易错字的词语对应的音频片段;
当所述音频片段与所述错误声学模型中的语音音频匹配结果为相符时,提示用户所述发音易错字发音错误,并根据所述映射表输出对应的所述标准声学模型中的语音音频。
进一步的,所述的建立发音易错字对应的标准声学模型和错误声学模型之间的映射表之前还包括:
获取所述发音易错字,根据所述发音易错字生成目标词语;
获取所述目标词语的语音音频,根据所述目标词语的语音音频生成所述标准声学模型;
获取所述发音易错字的发音混淆字,将所述目标词语中的所述发音易错字替换成所述发音混淆字生成混淆词语;
获取所述混淆词语的语音音频,根据所述混淆词语的语音音频生成所述错误声学模型。
进一步的,还包括:
当所述音频片段与所述标准声学模型中的语音音频匹配结果为相符时,提示用户所述发音易错字发音正确。
进一步的,还包括:
当所述音频片段与声学模型中的语音音频匹配结果不相符时,将所述音频片段转化为识别文本,所述声学模型包括所述标准声学模型和所述错误声学模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811239934.5/2.html,转载请声明来源钻瓜专利网。