[发明专利]语音区分模型训练方法、装置、计算机设备及存储介质有效
申请号: | 201810561701.0 | 申请日: | 2018-06-04 |
公开(公告)号: | CN109065027B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 涂宏 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L25/30;G10L15/05 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 胡志桐 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 区分 模型 训练 方法 装置 计算机 设备 存储 介质 | ||
本发明公开了一种语音区分模型训练方法、装置、计算机设备及存储介质。该方法包括:将标准训练语音数据和干扰训练语音数据输入到原始双向循环神经网络模型中进行训练,调整原始双向循环神经网络模型的权值和偏置,获取原始语音区分模型;获取待测试语音数据,待测试语音数据包括等比例配置的标准测试语音数据和干扰测试语音数据;将标准测试语音数据和干扰测试语音数据输入到原始语音区分模型中进行识别,获取识别准确率,若识别准确率大于预设阈值,则原始语音区分模型确定为目标语音区分模型。采用目标语音区分模型对语音进行区分,可以提高语音区分的准确率。
技术领域
本发明涉及语音处理领域,尤其涉及一种语音区分模型训练方法、装置、计算机设备及存储介质。
背景技术
一段未经处理的语音数据一般包括标准语音和干扰语音,其中标准语音是指语音数据中声纹连续变化明显的语音部分(即纯语音段),干扰语音可以是语音数据中由于静默而没有发音的语音数据(即静音段),也可以是环境噪音部分(即噪音段)。语音区分是对输入的语音数据进行筛选,以保留对识别具有意义的标准语音。当前主要采用端点检测技术对语音数据进行区分,这种语音区分方式,在标准语音中夹杂噪音时,随着噪音越大,进行语音区分的难度越大,其端点检测的识别结果越不准确。因此,采用端点检测技术进行语音区分时,其语音区分的识别结果容易受外部因素影响,使得语音区分结果不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种使语音区分结果不易受外部因素影响的语音区分模型训练方法、装置、设备及介质。
一种语音区分模型训练方法,包括:
对双向循环神经网络模型的权值和偏置进行初始化处理,获取原始双向循环神经网络模型;
获取待训练语音数据,所述待训练语音数据包括等比例配置的标准训练语音数据和干扰训练语音数据;
将所述标准训练语音数据和所述干扰训练语音数据输入到原始双向循环神经网络模型中进行训练,调整所述原始双向循环神经网络模型的权值和偏置,获取原始语音区分模型;
获取待测试语音数据,所述待测试语音数据包括等比例配置的标准测试语音数据和干扰测试语音数据;
将所述标准测试语音数据和干扰测试语音数据输入到原始语音区分模型中进行识别,获取所述标准测试语音数据或者干扰测试语音数据对应的识别准确率,若所述识别准确率大于预设阈值,则所述原始语音区分模型确定为目标语音区分模型。
一种语音模型训练装置,包括:
模型初始化模块,用于对双向循环神经网络模型的权值和偏置进行初始化处理,获取原始双向循环神经网络模型;
待训练语音数据获取模块,用于获取待训练语音数据,所述待训练语音数据包括等比例配置的标准训练语音数据和干扰训练语音数据;
模型训练模块,用于将所述标准训练语音数据和所述干扰训练语音数据输入到原始双向循环神经网络模型中进行训练,调整所述原始双向循环神经网络模型的权值和偏置,获取原始语音区分模型;
待测试语音数据获取模块,用于获取待测试语音数据,所述待测试语音数据包括等比例配置的标准测试语音数据和干扰测试语音数据;
模型获取模块,用于将所述标准测试语音数据和干扰测试语音数据输入到原始语音区分模型中进行识别,获取所述标准测试语音数据或者干扰测试语音数据对应的识别准确率,若所述识别准确率大于预设阈值,则所述原始语音区分模型确定为目标语音区分模型。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述语音区分模型训练方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810561701.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种录音控制方法及装置
- 下一篇:说话人聚类方法、装置、计算机设备及存储介质