[发明专利]设备唤醒相关方法、装置及故事机在审

申请号：	202010481877.2	申请日：	2020-05-28
公开（公告）号：	CN113744732A	公开（公告）日：	2021-12-03
发明（设计）人：	刘章;田彪;李昀;王子腾;纳跃跃	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26;G10L15/02;G10L21/0208;G10L25/84
代理公司：	北京润泽恒知识产权代理有限公司 11319	代理人：	钱秀茹
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	设备唤醒相关方法装置事机
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种设备唤醒方法，其特征在于，包括：

确定上一个语音帧的唤醒词概率；

根据唤醒词概率和上一个语音帧，调整滤波系数；

根据调整后的滤波系数，对当前语音帧执行语音增强处理，以抑制当前语音帧中目标声源以外的人声噪音；

根据抑制人声噪音后的当前语音帧识别唤醒词，以将设备调整至唤醒状态。

2.根据权利要求1所述的方法，其特征在于，所述确定上一个语音帧的唤醒词概率，包括：

根据调整前的滤波系数，对上一个语音帧执行语音增强处理；

确定语音增强后的上一个语音帧中唤醒词相关声学单元的声学概率；

根据所述唤醒词相关声学单元的声学概率，确定所述唤醒词概率。

3.根据权利要求2所述的方法，其特征在于，所述根据所述唤醒词相关声学单元的声学概率，确定所述唤醒词概率，包括：

将最大的声学概率作为所述唤醒词概率。

4.根据权利要求2所述的方法，其特征在于，还包括：

根据语音帧的采集时间，将各个语音帧顺序存储至缓存队列；

根据确定所述声学概率的处理时长，从所述缓存队列中读取上一个语音帧。

5.根据权利要求1所述的方法，其特征在于，所述根据唤醒词概率和上一个语音帧，调整滤波系数，包括：

将唤醒词概率作为上一个语音帧的权重，确定目标协方差矩阵和噪声协方差矩阵；

通过波束形成算法，根据目标协方差矩阵和噪声协方差矩阵，确定所述调整后的滤波系数。

6.根据权利要求1所述的方法，其特征在于，

所述上一个语音帧包括：与当前语音帧相邻的语音帧，或者，与当前语音帧不相邻的语音帧。

7.根据权利要求1所述的方法，其特征在于，

所述语音帧包括通过多个传声器采集的语音帧。

8.一种设备唤醒装置，其特征在于，包括：

唤醒词概率确定单元，用于确定上一个语音帧的唤醒词概率；

滤波系数调整单元，用于根据唤醒词概率和上一个语音帧，调整滤波系数；

人声噪音抑制单元，用于根据调整后的滤波系数，对当前语音帧执行语音增强处理，以抑制当前语音帧中目标声源以外的人声噪音；

唤醒单元，用于根据抑制人声噪音后的语音帧识别唤醒词，以将设备调整至唤醒状态。

9.根据权利要求8所述的装置，其特征在于，所述唤醒词概率确定单元包括：

语音增强子单元，用于根据调整前的滤波系数，对上一个语音帧执行语音增强处理；

声学概率确定子单元，用于确定语音增强后的上一个语音帧中唤醒词相关声学单元的声学概率；

唤醒词概率确定子单元，用于根据所述唤醒词相关声学单元的声学概率，确定所述唤醒词概率。

10.根据权利要求8所述的装置，其特征在于，所述滤波系数调整单元包括：

加权子单元，用于将唤醒词概率作为上一个语音帧的权重，根据加权后的上一个语音帧，确定目标协方差矩阵和噪声协方差矩阵；

滤波系数确定子单元，用于通过波束形成算法，根据目标协方差矩阵和噪声协方差矩阵，确定所述调整后的滤波系数。

11.一种故事机，其特征在于，包括：

处理器；以及

存储器，用于存储实现设备唤醒方法的程序，该设备通电并通过所述处理器运行该方法的程序后，执行下述步骤：确定上一个语音帧的唤醒词概率；根据唤醒词概率和上一个语音帧，调整滤波系数；根据调整后的滤波系数，对当前语音帧执行语音增强处理，以抑制当前语音帧中目标声源以外的人声噪音；根据抑制人声噪音后的语音帧识别唤醒词，以将故事机调整至唤醒状态。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司，未经阿里巴巴集团控股有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010481877.2/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]设备唤醒相关方法、装置及故事机在审

专利文献下载