[发明专利]一种语音识别发音错误的纠正方法及系统有效
申请号: | 201811239934.5 | 申请日: | 2018-10-23 |
公开(公告)号: | CN109461436B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 魏誉荧 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/02;G10L15/06;G10L15/10;G10L25/60 |
代理公司: | 上海硕力知识产权代理事务所(普通合伙) 31251 | 代理人: | 郭桂峰 |
地址: | 523851 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 发音 错误 纠正 方法 系统 | ||
1.一种语音识别发音错误的纠正方法,其特征在于,包括:
建立发音易错字对应的标准声学模型和错误声学模型之间的映射表;
获取用户语音信息;
识别所述用户语音信息,当所述语音信息中包含所述发音易错字时,提取所述用户语音信息中包含所述发音易错字的词语对应的音频片段;
当所述音频片段与所述错误声学模型中的语音音频匹配结果为相符时,提示用户所述发音易错字发音错误,并根据所述映射表输出对应的所述标准声学模型中的语音音频;
其中,所述的建立发音易错字对应的标准声学模型和错误声学模型之间的映射表之前还包括:获取所述发音易错字,根据所述发音易错字生成目标词语;
当所述音频片段与声学模型中的语音音频匹配结果不相符时,将所述音频片段转化为识别文本,所述声学模型包括所述标准声学模型和所述错误声学模型;
若所述目标词语包含所述识别文本,判断所述音频片段的发音是否正确,若是则根据所述音频片段更新所述标准声学模型;否则根据所述音频片段更新所述错误声学模型;
若所述目标词语不包含所述识别文本,则根据所述识别文本更新所述目标词语,并根据所述音频片段更新所述声学模型。
2.根据权利要求1所述的语音识别发音错误的纠正方法,其特征在于,所述的建立发音易错字对应的标准声学模型和错误声学模型之间的映射表之前还包括:
获取所述目标词语的语音音频,根据所述目标词语的语音音频生成所述标准声学模型;
获取所述发音易错字的发音混淆字,将所述目标词语中的所述发音易错字替换成所述发音混淆字生成混淆词语;
获取所述混淆词语的语音音频,根据所述混淆词语的语音音频生成所述错误声学模型。
3.根据权利要求1或2所述的语音识别发音错误的纠正方法,其特征在于,还包括:
当所述音频片段与所述标准声学模型中的语音音频匹配结果为相符时,提示用户所述发音易错字发音正确。
4.根据权利要求2所述的语音识别发音错误的纠正方法,其特征在于,所述的当所述目标词语不包含所述识别文本时,根据所述识别文本更新所述目标词语,并根据所述音频片段更新所述声学模型具体包括:
当所述目标词语不包含所述识别文本时,根据所述识别文本更新所述目标词语;
若所述音频片段发音正确,则根据所述音频片段更新所述标准声学模型,根据所述更新后的目标词语更新所述混淆词语,然后根据更新后的混淆词语的语音音频更新所述错误声学模型;
若所述音频片段发音错误,则获取所述识别文本的正确语音音频,根据所述正确语音音频更新所述标准声学模型,根据所述更新后的目标词语更新所述混淆词语,然后根据更新后的混淆词语的语音音频更新所述错误声学模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811239934.5/1.html,转载请声明来源钻瓜专利网。