[发明专利]语音唤醒识别方法、装置、电子设备及存储介质在审
申请号: | 201910618609.8 | 申请日: | 2019-07-09 |
公开(公告)号: | CN112216286A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 陈孝良;王江;冯大航;苏少炜 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L17/22 | 分类号: | G10L17/22;G10L17/04;G10L17/18;G10L17/02 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周天宇 |
地址: | 100086 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 唤醒 识别 方法 装置 电子设备 存储 介质 | ||
一种语音唤醒识别方法,应用于语音识别领域,包括:当接收到语音信号后,提取语音信号的声学特征,通过神经网络模型预测声学特征在各声学建模单元上的后验概率,根据后验概率,基于预置的一级评估模型评估是否进入二级评估装置,若进入二级评估装置,则基于后验概率,通过二级评估装置,判断是否进入唤醒状态。本发明还公开了一种语音唤醒识别装置、电子设备及存储介质,具有简单易行、功耗低,同时在保证唤醒率的前提下,降低了误唤醒率。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音唤醒识别方法、装置、电子设备及存储介质。
背景技术
随着智能交互技术的快速发展和市场需求的不断扩展,语音唤醒技术在近年来取得长足发展,至今已经在多个领域中得到广泛的应用。语音唤醒技术,是对输入的语音信号进行检测,确定语音信号中是否包含唤醒词。利用语音唤醒技术可以实现众多应用场景中的智能语音交互,例如智能音箱,车载、智能家居控制等。
目前,利用语音唤醒技术,在实际的产品中,常会出现误唤醒、高功耗等问题,从而影响用户的体验感。
发明内容
本发明的主要目的在于提供一种语音唤醒识别方法、装置、电子设备及存储介质,旨在解决现有技术中高功耗、误唤醒高的问题。
为实现上述目的,本发明实施例第一方面提供一种语音唤醒识别方法,包括:
当接收到语音信号后,提取所述语音信号的声学特征;
通过神经网络模型预测所述声学特征在各声学建模单元上的后验概率;
根据所述后验概率,基于预置的一级评估模型评估是否进入二级评估装置;
若进入二级评估装置,则基于所述后验概率,通过所述二级评估装置,判断是否进入唤醒状态。
进一步地,所述根据所述后验概率,基于预置的一级评估模型评估是否进入二级评估装置,包括:
获取预设窗口内各声学建模单元的最大后验概率、各声学建模单元的预设权重系数和各声学建模单元的惩罚值;
将所述各声学建模单元的最大后验概率、各声学建模单元的预设权重系数和各声学建模单元的惩罚值,输入至预置的一级评估模型,得到第一评估值;
判断所述第一评估值是否大于预设阈值;
若是,则进入二级评估装置;
若否,则所述预设窗口内不存在唤醒词,不进入唤醒状态。
进一步地,所述一级评估模型具体为:
令Z表示评估值,n表示第n个声学建模单元,xn表示在一个移动窗口内第n个声学建模单元的最大特征值,cn表示第n个声学建模单元的预设权重系数,bn表示第n个声学建模单元的惩罚值,则:
进一步地,所述二级评估装置采用预训练的支持向量机模型;
所述若进入二级评估装置,则基于所述后验概率,通过所述二级评估装置,判断是否进入唤醒状态,包括:
若进入二级评估装置,则将所述后验概率输入至所述预训练的支持向量机模型,得到所述语音信号中是否包括唤醒词的分类结果;
若所述分类结果是包含唤醒词,则进入唤醒状态;
若所述分类结果是不包括唤醒词,则不进入唤醒状态。
本发明实施例第二方面提供一种语音唤醒识别装置,包括:
提取模块,用于当接收到语音信号后,提取所述语音信号的声学特征;
预测模块,用于通过神经网络模型预测所述声学特征在各声学建模单元上的后验概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910618609.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:含有膨胀型防火阻尼毡的电动汽车
- 下一篇:一种激光锡焊机及其操作方法