[发明专利]一种训练唤醒模型的方法及装置有效
申请号: | 202010461982.X | 申请日: | 2020-05-27 |
公开(公告)号: | CN111667818B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 靳源;冯大航;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22;G10L15/26 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李琴 |
地址: | 100080 北京市海淀区北四*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 唤醒 模型 方法 装置 | ||
1.一种训练唤醒模型的方法,其特征在于,所述方法包括:
触发模型训练时,获取第一训练集和第二训练集,所述第一训练集包括用于训练初始声学模型的初始语音特征数据,所述第二训练集包括声学模型在唤醒语音识别过程中,对应的漏唤醒/误唤醒语音的新语音特征数据;
将所述第一训练集分别输入到初始声学模型和当前声学模型,通过对比所述初始声学模型和当前声学模型的输出结果,确定第一差异参数;
将所述第二训练集输入当前声学模型,通过对比所述当前声学模型的输出结果和当前声学模型能够识别的唤醒语音对应的独热编码,确定第二差异参数;
根据所述第一差异参数和第二差异参数,调整当前声学模型的模型参数。
2.根据权利要求1所述的方法,其特征在于,确定第一差异参数,包括:
获取所述初始声学模型输出的唤醒语音识别结果对应的第一概率分布,及所述当前声学模型输出的唤醒语音识别结果对应的第二概率分布;
根据所述第一概率分布和第二概率分布的差异确定相对熵。
3.根据权利要求1所述的方法,其特征在于,确定第二差异参数,包括:
获取所述当前声学模型输出的唤醒语音识别结果对应的第三概率分布,及所述独热编码对应的第四概率分布;
根据所述第三概率分布和第四概率分布的差异确定交叉熵。
4.根据权利要求1所述的方法,其特征在于,确定第二差异参数之后,还包括:
确定当前声学模型为初始声学模型时,根据所述第二差异参数调整初始声学模型的模型参数。
5.根据权利要求4所述的方法,其特征在于,根据所述第二差异参数调整初始声学模型的模型参数,包括:
根据第二差异参数确定用于调整初始声学模型的损失函数,利用所述损失函数调整初始声学模型中各网络层的参数,得到当前声学模型。
6.根据权利要求1所述的方法,其特征在于,根据所述第一差异参数和所述第二差异参数,调整当前声学模型的模型参数,包括:
根据所述第一差异参数和所述第二差异参数,确定用于调整当前声学模型的损失函数,利用所述损失函数调整当前声学模型中各网络层的参数。
7.根据权利要求1所述的方法,其特征在于,所述初始语音特征数据或新语音特征数据包括如下至少一种:
梅尔倒谱系数MFCC特征数据;
感知线性预测PLP特征数据;
梅尔标度滤波FBANK特征数据。
8.根据权利要求1所述的方法,其特征在于,获取当前声学模型能够识别的唤醒语音对应的独热编码,包括:
获取当前声学模型能够识别的预置唤醒语音信息;
将所述预置唤醒语音信息输入到ASR语音模型,根据所述ASR语音模型的识别结果,确定当前声学模型能够识别的语音单元对应的独热编码,所述语音单元包括音素状态、音素和单词中的至少一种。
9.一种训练唤醒模型的装置,其特征在于,所述装置包括:存储器,用于存储指令;
处理器,用于读取所述存储器中的指令,实现如权利要求1~8任一项所述的一种训练唤醒模型的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010461982.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种中药/天然植物提取的数学建模方法
- 下一篇:一种锂电池烘干装置