[发明专利]设备唤醒相关方法、装置及故事机在审
申请号: | 202010481877.2 | 申请日: | 2020-05-28 |
公开(公告)号: | CN113744732A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 刘章;田彪;李昀;王子腾;纳跃跃 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/02;G10L21/0208;G10L25/84 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 钱秀茹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 设备 唤醒 相关 方法 装置 事机 | ||
1.一种设备唤醒方法,其特征在于,包括:
确定上一个语音帧的唤醒词概率;
根据唤醒词概率和上一个语音帧,调整滤波系数;
根据调整后的滤波系数,对当前语音帧执行语音增强处理,以抑制当前语音帧中目标声源以外的人声噪音;
根据抑制人声噪音后的当前语音帧识别唤醒词,以将设备调整至唤醒状态。
2.根据权利要求1所述的方法,其特征在于,所述确定上一个语音帧的唤醒词概率,包括:
根据调整前的滤波系数,对上一个语音帧执行语音增强处理;
确定语音增强后的上一个语音帧中唤醒词相关声学单元的声学概率;
根据所述唤醒词相关声学单元的声学概率,确定所述唤醒词概率。
3.根据权利要求2所述的方法,其特征在于,所述根据所述唤醒词相关声学单元的声学概率,确定所述唤醒词概率,包括:
将最大的声学概率作为所述唤醒词概率。
4.根据权利要求2所述的方法,其特征在于,还包括:
根据语音帧的采集时间,将各个语音帧顺序存储至缓存队列;
根据确定所述声学概率的处理时长,从所述缓存队列中读取上一个语音帧。
5.根据权利要求1所述的方法,其特征在于,所述根据唤醒词概率和上一个语音帧,调整滤波系数,包括:
将唤醒词概率作为上一个语音帧的权重,确定目标协方差矩阵和噪声协方差矩阵;
通过波束形成算法,根据目标协方差矩阵和噪声协方差矩阵,确定所述调整后的滤波系数。
6.根据权利要求1所述的方法,其特征在于,
所述上一个语音帧包括:与当前语音帧相邻的语音帧,或者,与当前语音帧不相邻的语音帧。
7.根据权利要求1所述的方法,其特征在于,
所述语音帧包括通过多个传声器采集的语音帧。
8.一种设备唤醒装置,其特征在于,包括:
唤醒词概率确定单元,用于确定上一个语音帧的唤醒词概率;
滤波系数调整单元,用于根据唤醒词概率和上一个语音帧,调整滤波系数;
人声噪音抑制单元,用于根据调整后的滤波系数,对当前语音帧执行语音增强处理,以抑制当前语音帧中目标声源以外的人声噪音;
唤醒单元,用于根据抑制人声噪音后的语音帧识别唤醒词,以将设备调整至唤醒状态。
9.根据权利要求8所述的装置,其特征在于,所述唤醒词概率确定单元包括:
语音增强子单元,用于根据调整前的滤波系数,对上一个语音帧执行语音增强处理;
声学概率确定子单元,用于确定语音增强后的上一个语音帧中唤醒词相关声学单元的声学概率;
唤醒词概率确定子单元,用于根据所述唤醒词相关声学单元的声学概率,确定所述唤醒词概率。
10.根据权利要求8所述的装置,其特征在于,所述滤波系数调整单元包括:
加权子单元,用于将唤醒词概率作为上一个语音帧的权重,根据加权后的上一个语音帧,确定目标协方差矩阵和噪声协方差矩阵;
滤波系数确定子单元,用于通过波束形成算法,根据目标协方差矩阵和噪声协方差矩阵,确定所述调整后的滤波系数。
11.一种故事机,其特征在于,包括:
处理器;以及
存储器,用于存储实现设备唤醒方法的程序,该设备通电并通过所述处理器运行该方法的程序后,执行下述步骤:确定上一个语音帧的唤醒词概率;根据唤醒词概率和上一个语音帧,调整滤波系数;根据调整后的滤波系数,对当前语音帧执行语音增强处理,以抑制当前语音帧中目标声源以外的人声噪音;根据抑制人声噪音后的语音帧识别唤醒词,以将故事机调整至唤醒状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010481877.2/1.html,转载请声明来源钻瓜专利网。