[发明专利]唤醒模型训练方法、唤醒词识别方法、装置及电子设备在审
申请号: | 202010647828.1 | 申请日: | 2020-07-07 |
公开(公告)号: | CN111833902A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 曹冰 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/51;G10L25/78;G06K9/62;G06N3/08;G10L15/22 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 吕静 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 唤醒 模型 训练 方法 识别 装置 电子设备 | ||
1.一种唤醒模型训练方法,其特征在于,所述方法包括:
通过语音检测算法对采集的音频进行语音检测,确定所述采集的音频中语音信号的起点和终点,所述语音信号中包括唤醒词;
确定所述语音信号中起点和终点之间的中间点;
从所述采集的音频中选取包括所述中间点的预设时间长度的音频段,作为正样本;
从所述采集的音频中,选取预设时间长度且不同于所述正样本的音频段,作为负样本;
通过所述正样本和负样本对待训练唤醒模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述通过所述正样本和负样本对待训练唤醒模型进行训练之后,还包括:
记录训练后的唤醒模型的识别准确率;
改变预设时间长度,执行步骤从所述采集的音频中选取包括所述中间点的预设时间长度的音频段至记录训练后的唤醒模型的识别准确率,直至获得识别准确率最高的唤醒模型,作为用于唤醒词识别的唤醒模型。
3.根据权利要求2所述的方法,其特征在于,所述记录训练后的唤醒模型对正样本和负样本的识别准确率;改变预设时间长度,执行步骤从所述采集的音频中选取包括所述中间点的预设时间长度的音频段至记录训练后的唤醒模型的识别准确率,直至获得识别准确率最高的唤醒模型,作为用于唤醒词识别的唤醒模型,包括:
在第一次确定的预设时间长度的基础上,依次减小预设时间长度,对应减小的每一个预设时间长度,执行步骤从所述采集的音频中选取包括所述中间点的预设时间长度的音频段至记录训练后的唤醒模型的识别准确率,
若当前记录的识别准确率小于上一次记录的识别准确率,在第一次确定的预设时间长度的基础上,依次增大预设时间长度,对应增大的每一个预设时间长度,执行步骤从所述采集的音频中选取包括所述中间点的预设时间长度的音频段至记录训练后的唤醒模型的识别准确率,
若当前记录的识别准确率小于上一次记录的识别准确率,以记录的最高的识别准确率对应的唤醒模型作为用于唤醒词识别的唤醒模型。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述从所述采集的音频中选取包括所述中间点的预设时间长度的音频段,包括:
从所述中间点向前和向后分别选取指定时间长度的音频段,所述指定时间长度为所述预设时间长度的一半。
5.根据权利要求1所述的方法,其特征在于,所述通过语音检测算法对采集的音频进行语音检测之前,还包括:
通过所述语音检测算法对测试音频进行语音检测,确定所述测试音频中语音信号的起点和终点;
判断检测到的所述测试音频中语音信号的起点和终点是否准确;
若不准确,调整所述语音检测算法的参数,重新执行所述通过所述语音检测算法对测试音频进行语音检测,确定所述测试音频中语音信号的起点和终点;判断检测的所述测试音频的起点和终点是否准确;若不准确,调整所述语音检测算法的参数的步骤,直至检测的所述测试音频的起点和终点准确。
6.一种唤醒词识别方法,其特征在于,根据权利要求1至5任一项所述的方法获得的唤醒模型进行唤醒词识别,所述方法包括:
通过语音检测算法从待识别音频中确定语音信号的中间点;
从所述待识别音频中选取包括所述中间点的预设时间长度的音频段,作为输入音频;
将所述输入音频输入所述唤醒模型,获取所述唤醒模型的输出结果;
若所述输出结果表示所述输入音频与正样本为相同类别,执行识别到唤醒词对应的操作。
7.一种唤醒模型训练装置,其特征在于,所述训练装置包括:
语音检测模块,用于通过语音检测算法对采集的音频进行语音检测,确定所述采集的音频中语音信号的起点和终点,所述语音信号中包括唤醒词;
音频处理模块,用于确定所述语音信号中起点和终点之间的中间点;
正样本选取模块,用于从所述采集的音频中选取包括所述中间点的预设时间长度的音频段,作为正样本;
负样本选取模块,用于从所述采集的音频中,选取预设时间长度且不同于所述正样本的音频段,作为负样本;
训练模块,用于通过所述正样本和负样本对唤醒模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010647828.1/1.html,转载请声明来源钻瓜专利网。