[发明专利]语音识别方法、装置及电子设备有效
申请号: | 202010503214.6 | 申请日: | 2020-06-05 |
公开(公告)号: | CN111768762B | 公开(公告)日: | 2022-01-21 |
发明(设计)人: | 张骏;黄露 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 陈龙 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 | ||
本公开实施例中提供了一种语音识别方法、装置及电子设备,属于数据处理技术领域,该方法包括:利用预先设置的训练样本,随机初始化并训练LSTM网络模型;基于设置的与CTC损失函数相关的第一训练参数以及与KL散度相关的第二训练参数,利用所述LSTM网络的训练结果,形成用于训练BLSTM网络的损失函数;在训练所述BLSTM网络的过程中,在逐渐增大所述第一训练参数的值的同时,逐渐减小所述第二训练参数的值;当所述BLSTM网络输出的性能指标满足预设要求后,停止对所述BLSTM网络的训练,以便于利用所述BLSTM网络对输入的声音文件进行实时的文字预测。通过本公开的处理方案,能够提高声学网络模型预测的时间戳准确度。
技术领域
本公开涉及数据处理技术领域,尤其涉及一种声学网络模型训练方法、装置及电子设备。
背景技术
语音处理(Speech processing),又称语音信号处理、人声处理,其目的是希望做出想要的信号,进一步做语音识别,应用到手机界面甚至一般生活中,使人与电脑能进行沟通。
语音处理的过程中,可以用麦克风或其他装置收到的类音声音信号,经由模拟数字变换装置,将资料数据化进行处理,最后再经过数字模拟变换装置输出。因此,在处理时是针对数字信号,语音信号是一种离散时间信号。其信号处理流程如下:收取并采样信号:利用麦克风或各种收音装置,收取模拟语音信号,再用ADC装置(如模拟数字变换卡)把模拟信号变成数字信号,接着根据奈奎斯特理论作采样,若不符合理论则会造成信号失真。量化及编码:由于电脑中的记忆都是0和1,因此要将所收到的数据用一段适合的0跟1去储存,这个动作就称为量化,所使用的0与1越多,所需的内存越多。接着利用编码器将数值以波形呈现。将语音信号标准化,使其数值都落在同一个范围。由于语音信号是一段很长的信号,因此会针对想要处理的部分取音框。由于噪声多集中在高频的部分,因此利用简单的高频滤波器,就可以去掉部分噪声。
BLSTM(Bidirectional Long Short-Term Memory,双向长短时记忆网络)在进行语音识别的过程中,存在预测结果的时间戳不稳定的情况,具体而言,相对于LSTM,存在偏前或者偏后的情况,为此,需要通过改进网络训练,使得BLSTM网络的预测结果的时间戳趋于稳定。
发明内容
有鉴于此,本公开实施例提供一种声学网络模型训练方法、装置及电子设备,以至少部分解决现有技术中存在的问题。
第一方面,本公开实施例提供了一种声学网络模型训练方法,包括:
利用预先设置的训练样本,随机初始化并训练长短时记忆LSTM网络模型;
基于设置的与CTC损失函数相关的第一训练参数以及与KL散度相关的第二训练参数,利用所述LSTM网络的训练结果,形成用于训练双向长短时记忆BLSTM网络的损失函数;
在训练所述BLSTM网络的过程中,在逐渐增大所述第一训练参数的值的同时,逐渐减小所述第二训练参数的值;
当所述BLSTM网络输出的性能指标满足预设要求后,停止对所述BLSTM网络的训练,以便于利用所述BLSTM网络对输入的语音文件进行文字预测。
根据本公开实施例的一种具体实现方式,所述利用预先设置的训练样本,随机初始化并训练LSTM网络模型之前,所述方法还包括:
获取多个语音文件;
对所述多个语音文件进行语义标注;
基于标注后的语义文件,形成所述训练样本。
根据本公开实施例的一种具体实现方式,所述利用预先设置的训练样本,随机初始化并训练LSTM网络模型,包括:
将所述训练样本作为所述LSTM网络模型的输入;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010503214.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:钢轨焊缝全断面铣磨机、作业车及使用方法
- 下一篇:一种防撞式定点无人机