[发明专利]置信度校正及其模型训练方法、装置、设备及存储介质有效
申请号: | 202010060233.6 | 申请日: | 2020-01-19 |
公开(公告)号: | CN111326148B | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 谷悦;杨嵩;袁军峰;刘子韬 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/06;G10L15/16;G10L15/26 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 置信 校正 及其 模型 训练 方法 装置 设备 存储 介质 | ||
本发明实施例提供了一种置信度校正模型训练方法和装置、置信度校正方法和装置、电子设备及计算机存储介质。所述置信度校正模型训练方法包括:获取多个训练样本;针对每个训练样本,基于其包括的识别文本和该识别文本的置信度,从多个置信度校正类别中,确定该训练样本所属的置信度校正类别;将每个训练样本的音频样本和识别文本作为输入,将基于该训练样本所属的置信度校正类别构建的概率向量作为输出,训练基于神经网络的置信度校正模型。通过本发明实施例,能够训练得到可靠的置信度校正模型。
技术领域
本发明实施例涉及机器学习技术领域,尤其涉及一种置信度校正模型训练方法和装置、置信度校正方法和装置、电子设备及计算机存储介质。
背景技术
语音识别是一种让机器通过识别和理解过程把语音信号转变为相应的文本或命令的人工智能技术。由于现有的语音识别技术还无法完全正确地识别出语音内容,因此通常使用置信度来表示识别结果的可靠性。
传统的置信度计算方法主要包括基于预测特征的方法(Predictor featuresbased CM)和基于后验概率的方法(Posterior based CM)。由于这两种计算方法仅依赖于语音识别模型本身的能力,而真实的业务场景诸如环境中存在的背景噪声和混响以及多种设备间存在着信道不匹配的问题而变得极为复杂,使得置信度打分不准确。
发明内容
有鉴于此,本发明实施例提供一种置信度校正模型训练方法和装置、置信度校正方法和装置、电子设备及计算机存储介质,能够可靠地校正语音识别中的置信度。
根据本发明实施例的第一方面,提供了一种置信度校正模型训练方法,包括:获取多个训练样本,其中,每个训练样本中包括音频样本和对所述音频样本识别出的识别文本和该识别文本的置信度;针对每个训练样本,基于其包括的识别文本和该识别文本的置信度,从多个置信度校正类别中,确定该训练样本所属的置信度校正类别;将每个训练样本的音频样本和识别文本作为输入,将基于该训练样本所属的置信度校正类别构建的概率向量作为输出,训练基于神经网络的置信度校正模型。
根据本发明实施例的第二方面,提供了一种置信度校正方法,包括:基于置信度校正模型,确定待校正语音识别任务所属的置信度校正类别构建的概率向量,其中,所述置信度校正模型通过如第一方面所述的置信度校正模型训练方法所训练获得;基于所述待校正语音识别任务所属的置信度校正类别构建的概率向量,对所述待校正语音识别任务进行置信度校正。
根据本发明实施例的第三方面,提供了一种置信度校正模型训练装置,包括:获取模块,获取多个训练样本,其中,每个训练样本中包括音频样本和对所述音频样本识别出的识别文本和该识别文本的置信度;第一确定模块,针对每个训练样本,基于其包括的识别文本和该识别文本的置信度,从多个置信度校正类别中,确定该训练样本所属的置信度校正类别;训练模块,将每个训练样本的音频样本和识别文本作为输入,将基于该训练样本所属的置信度校正类别构建的概率向量作为输出,训练基于神经网络的置信度校正模型。
根据本发明实施例的第四方面,提供了一种置信度校正装置,包括:第一确定模块,基于置信度校正模型,确定待校正语音识别任务所属的置信度校正类别构建的概率向量,其中,所述置信度校正模型通过如第三方面所述的置信度校正模型训练装置训练获得;校正模块,基于所述待校正语音识别任务所属的置信度校正类别构建的概率向量,对所述待校正语音识别任务进行置信度校正。
根据本发明实施例的第五方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或第二方面所述的方法对应的操作。
根据本发明实施例的第六方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010060233.6/2.html,转载请声明来源钻瓜专利网。