[发明专利]基于人工智能的唤醒词检测方法、装置、设备及介质有效

专利信息
申请号: 201911124453.4 申请日: 2019-11-14
公开(公告)号: CN110838289B 公开(公告)日: 2023-08-11
发明(设计)人: 陈杰;苏丹;金明杰;朱振岭 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G10L15/16 分类号: G10L15/16;G10L15/197;G10L15/22;G10L15/02;G06N3/08;G06N3/0464
代理公司: 北京志霖恒远知识产权代理有限公司 11435 代理人: 成丹
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 人工智能 唤醒 检测 方法 装置 设备 介质
【说明书】:

本申请公开了一种基于人工智能的唤醒词检测方法、装置、设备及其存储介质。该方法包括:获取待识别语音数据,并提取待识别语音数据中每个语音帧的语音特征;将语音特征输入到预先构建的深度神经网络模型,输出语音特征对应于音节标识的后验概率向量,该深度神经网络模型包括与预先构建的发音字典的音节的数量相同的音节输出单元;根据音节组合序列从后验概率向量中确定目标概率向量,该音节组合序列是基于输入的唤醒词文本构建的;再根据目标概率向量计算置信度,且在置信度大于等于阈值时确定语音帧包含唤醒词文本。本申请实施例提供的方案,计算复杂度低,且响应速度快,无需针对固定唤醒词进行专门优化改进,有效地提升了唤醒检测效率。

技术领域

本申请一般涉及语音识别技术领域,尤其涉及基于人工智能的唤醒词检测方法、装置、设备及介质。

背景技术

语音技术(Speech Technology)的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。将语音技术应用于电子设备,实现唤醒电子设备的功能,即语音唤醒技术。通常语音唤醒(KeyWord Spotting,KWS)是通过设定一个固定的唤醒词,在用户说出唤醒词之后,终端上的语音识别功能,才会处于工作状态,否则处于休眠状态。例如,通过基于深度神经网络构建的声学模型输出识别结果,该声学模型是按照固定设置的唤醒词对应的音节或音素训练的,但其不支持唤醒词的修改。

为了满足用户对唤醒词自定义的需求,现有技术也存在基于自定义唤醒方案,例如基于隐马尔可夫模型(Hidden Markov Model,HMM)模型的自定义唤醒词方案,该方案包括声学模型和HMM解码网络两部分,在唤醒词检测过程中,语音感召固定窗大小输入解码网络,然后利用维特比解码算法查找最优解码路径,其存在计算量大、延迟响应慢的缺点。

发明内容

鉴于现有技术中的上述缺陷或不足,期望提供一种基于人工智能的唤醒词检测方法、装置、设备及介质,在满足用户对唤醒词自定义的需求时,有效地降低计算复杂度提升响应速度。

第一方面,本申请实施例提供了一种基于人工智能的唤醒词检测方法,该方法包括:

获取待识别语音数据,并提取待识别语音数据中每个语音帧的语音特征;

将语音特征输入到预先构建的深度神经网络模型,输出语音特征对应于音节标识的后验概率向量,该深度神经网络模型包括与预先构建的发音字典的音节的数量相同的音节输出单元;

根据音节组合序列从后验概率向量中确定目标概率向量,该音节组合序列是根据输入的唤醒词文本构建的;

再根据目标概率向量计算置信度,且在置信度大于等于阈值时确定语音帧包含唤醒词文本。

第二方面,本申请实施例提供了一种基于人工智能的唤醒词检测装置,该装置包括:

语音特征提取单元,用于获取待识别语音数据,并提取待识别语音数据中每个语音帧的语音特征;

语音特征识别单元,用于将语音特征输入到预先构建的深度神经网络模型,输出语音特征对应于音节标识的后验概率向量,该深度神经网络模型包括与预先构建的发音字典的音节的数量相同的音节输出单元;

置信度判决单元,用于根据音节组合序列从后验概率向量中确定目标概率向量,该音节组合序列是根据输入的唤醒词文本构建的;再根据目标概率向量计算置信度,且在置信度大于等于阈值时确定语音帧包含唤醒词文本。

第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如本申请实施例描述的方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序用于:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911124453.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top