[发明专利]一种语音唤醒方法及装置在审

申请号：	201910872875.3	申请日：	2019-09-16
公开（公告）号：	CN112509556A	公开（公告）日：	2021-03-16
发明（设计）人：	陈天峰;冯大航;陈孝良;常乐	申请（专利权）人：	北京声智科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/04;G10L15/16;G10L15/26;G10L19/008
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	朱琳爱义
地址：	100080 北京市海淀区北四***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音唤醒方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开实施例提供的一种语音唤醒方法及装置，通过在解码路径中引入了唤醒字之间的冗余旁路，在对语音信号的后验概率进行解码时，可以抽取出除了唤醒字以外的其他音素集合，即解码路径除了可以区分出唤醒字对应的音素，还可以额外获得非唤醒字音素对应的语音片段，即解码结果中包括了语音信号中分别属于唤醒语音片段和冗余语音片段的音频。之后，对冗余语音片段的音频信息进行解析可以得到冗余怀疑度，在判断是否执行唤醒动作时，同时依据解码结果对应的唤醒得分和冗余怀疑度，可以提高判断准确性，抑制误唤醒。

技术领域

本发明涉及语音处理技术领域，尤指一种语音唤醒方法及装置。

背景技术

随着信息和通信技术的发展，智能设备已经在日常生活在被广泛应用。智能设备可以通过麦克风采集语音信号，在进行识别后提供相应的服务。智能设备一般都包含用某个唤醒词(由多个唤醒字构成)唤醒的功能，即语音唤醒功能。

语音唤醒需要解决的两个最关键的问题，一是提高唤醒率，即任何性别、任何年龄段、任何场景(安静、带噪、远场...)都能准确响应；二就是降低误唤醒，即外界的噪声，周边人的讨论声，电视剧播放的内容等，只要不含有唤醒词，智能设备就不能误响应。

误唤醒会极大的影响用户体验，比如办公室买了一个具备唤醒功能的智能音箱，在与同事讨论的时候音箱误唤醒，甚至开始播放歌曲，这种情形令人厌烦甚至愤怒。

发明内容

本发明实施例提供一种语音唤醒方法及装置，用以抑制语音唤醒中的误唤醒。

一方面，本发明实施例提供了一种语音唤醒方法，包括：

确定获取到的语音信号的后验概率，所述后验概率为所述语音信号中每帧音频对应于预设的各标准音素的概率；

采用预先建立的解码路径，对所述语音信号的后验概率进行解码，得到所述语音信号的解码结果并计算所述语音信号的唤醒得分；其中，所述解码路径包含在设定的各唤醒字之间构建的支路和在所述唤醒字之间构建的冗余旁路，所述解码结果包括：所述语音信号中分别属于唤醒语音片段和冗余语音片段的音频，以及所述语音信号中每帧音频对应的音素编号和概率；

根据所述语音信号的解码结果，确定属于所述冗余语音片段的音频的音频信息；

根据所述冗余语音片段的音频的音频信息确定冗余怀疑度；

根据所述唤醒得分和所述冗余怀疑度，确定是否执行唤醒动作。

在一种可能的实现方式中，在本发明实施例提供的上述方法中，所述确定获取到的语音信号的后验概率，具体包括：

对获取到的所述语音信号进行前端处理，得到所述语音信号中每帧音频的前端特征；

将所述语音信号中每帧音频的前端特征输入至第一神经网络模型中进行计算，得到所述语音信号中每帧音频对应于各所述标准音素的概率。

在一种可能的实现方式中，在本发明实施例提供的上述方法中，所述确定属于所述冗余语音片段的音频的音频信息，具体包括：

确定属于所述冗余语音片段的每帧音频的前端特征，以及属于所述冗余语音片段的每帧音频的语音能量。

在一种可能的实现方式中，在本发明实施例提供的上述方法中，所述根据所述冗余语音片段的音频的音频信息确定冗余怀疑度，具体包括：

将所述音频信息输入至预设的第二神经网络模型中，得到冗余怀疑度。

在一种可能的实现方式中，在本发明实施例提供的上述方法中，在确定属于所述冗余语音片段的音频的音频信息之前，还包括：

判断所述语音信号的唤醒得分是否大于设定的第一阈值；