[发明专利]一种语音输入矫正处理方法、装置、电子设备及存储介质有效

申请号：	202110014882.7	申请日：	2021-01-06
公开（公告）号：	CN112786027B	公开（公告）日：	2022-02-22
发明（设计）人：	胡志鹏;杨天格;卜佳俊	申请（专利权）人：	浙江大学;网易(杭州)网络有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/07
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	钟扬飞
地址：	310000 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音输入矫正处理方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供一种语音输入矫正处理方法、装置、电子设备及存储介质，涉及语音识别技术领域。该方法包括：获取用户输入的待识别语音；对第一待识别语音进行特征提取，得到待识别语音特征；采用用户对应的语音矫正模型，对待识别语音特征进行识别，得到待识别语音对应的识别文本，语音矫正模型根据训练语音特征和指定文本进行模型训练得到，训练语音特征根据用户朗读指定文本的训练语音进行特征提取得到，指定文本为满足预设音节组合条件的指定文本；获取用户输入的针对识别文本的更新文本；根据更新文本，以及待识别语音特征，对语音矫正模型进行更新。本申请可减小对于发音不标准用户基于语音识别技术的语音沟通障碍，提高用户的使用体验。

技术领域

本申请涉及语音识别技术领域，具体而言，涉及一种语音输入矫正处理方法、装置、电子设备及存储介质。

背景技术

随着语音识别技术的发展，语音识别功能在越来越多的应用场景中被使用。

目前的语音识别功能大多是采用语音识别模型实现，而语音识别模型的训练是采用基于标准语音的训练库进行训练。然而，在实际应用场景，用户的语言生长环境或者身体生理原因等多方面原因，都可能导致用户的发音可能不是很标准。

对于这一部分发音不标准的用户，采用通用的语音识别可能存在识别无效如识别不准确、甚至无法识别等问题，使得这一部分用户使用语音识别技术的语音沟通存在很大的阻碍，严重影响用户的使用体验。

发明内容

本申请的目的在于，针对上述现有技术中的不足，提供一种语音输入矫正处理方法、装置、电子设备及存储介质，以减小对于发音不标准用户基于语音识别技术的语音沟通障碍，提高用户的使用体验。

为实现上述目的，本申请实施例采用的技术方案如下：

第一方面，本申请实施例提供了一种语音输入矫正处理方法，包括：

获取用户输入的第一待识别语音；

对所述第一待识别语音进行特征提取，得到第一待识别语音特征；

采用所述用户对应的语音矫正模型，对所述第一待识别语音特征进行识别，得到所述第一待识别语音对应的第一识别文本，其中，所述用户对应的所述语音矫正模型根据训练语音特征和第一指定文本进行模型训练得到，所述训练语音特征根据训练语音进行特征提取得到，所述训练语音为获取的所述用户朗读第一指定文本的训练语音，所述第一指定文本为满足预设音节组合条件的指定文本；

获取所述用户输入的针对所述第一识别文本的更新文本；

根据所述更新文本，以及所述第一待识别语音特征，对所述语音矫正模型进行更新。

可选的，所述方法还包括：

获取所述用户输入的第二待识别语音；

对所述第二待识别语音进行特征提取，得到第二待识别语音特征；

采用更新后的所述语音矫正模型，对所述第二待识别语音特征进行识别，得到所述第二待识别语音对应的第二识别文本。

可选的，所述采用所述用户对应的语音矫正模型，对所述第一待识别语音特征进行识别，得到所述第一待识别语音对应的第一识别文本之前，所述方法还包括：

获取针对所述用户的评价语音以及所述评价语音对应的文本；

对所述评价语音进行特征提取，得到所述用户的评价语音特征；

根据所述评价语音特征和所述评价语音对应的文本对所述用户对应的所述语音矫正模型进行矫正。

可选的，所述获取针对所述用户的评价语音以及所述评价语音对应的文本，包括：

获取所述用户朗读第二指定文本的语音，其中，所述第二指定文本和所述第一指定文本为不同的指定文本；