[发明专利]利用语音唤醒执行语音识别的方法和装置在审
申请号: | 202080037110.9 | 申请日: | 2020-05-15 |
公开(公告)号: | CN113841196A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 韩昌玗;辛珉圭;刘钟旭;李度昀;崔康硕;李在原;林贤泽 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L21/02;G10L21/0216 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;杨莘 |
地址: | 韩国京畿道水*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 语音 唤醒 执行 识别 方法 装置 | ||
一种语音识别方法,包括:接收第一多声道音频信号;针对与第一多声道音频信号中包括的声道音频信号对应的频带的至少一个频带,获取语音信号特性或噪声信号特性中的至少一个;通过基于语音信号特性、噪声信号特性以及在获取第一多声道音频信号的特定时间之前获取的且针对先前帧获取的语音信号特性对第一多声道音频信号进行波束形成,从而生成具有经增强语音分量的信号;确定经增强语音分量是否包括唤醒词;以及基于确定出经增强语音分量包括唤醒词:基于具有经增强语音分量的信号启用语音识别操作。
技术领域
本公开涉及一种用于执行语音识别的方法和装置,更具体地,涉及一种用于执行针对唤醒词启用(例如,对语音干扰具有鲁棒性的语音唤醒(WoV))的前端处理的语音识别操作方法和装置。
背景技术
随着已经开发了组合地执行各种功能的电子装置,已经发布了配备有语音识别功能的电子装置以提高可操作性。语音识别功能可以通过以免提方式(例如,无需单独的按钮操作或触摸模块的接触)识别用户的语音来容易地控制装置。
根据语音识别功能,例如,诸如智能电话的便携式终端和诸如电视(TV)、冰箱等的家用电器可以在不用按下单独的按钮的情况下执行呼叫功能或写入文本消息,并且可以容易地设置各种功能,例如方向导航、因特网搜索、警报设置等。
为了通过位于距离语音识别装置很远距离处的用户的语音来控制,语音识别装置必须能够即使在噪声环境中也确保稳定的性能。为了确保稳定的性能,可以使用语音唤醒(WoV)技术,其中用户向语音识别装置通知何时开始语音识别操作。为了唤醒语音识别装置,用户可以说出唤醒词(例如,先前添加的在主指令词之前要确定的词)。WoV技术是语音控制中的第一步,因此需要高精确度。
另一方面,人工智能(AI)系统是一种具有人类级别的智能的计算机系统。与现有的基于规则的智能系统不同,AI系统是一种可以自主地训练自己、做出决策并且变得越来越智能的系统。AI系统被使用得越多,AI系统的识别率就可改进得越高并且AI系统可以更准确地理解用户偏好,因此,现有的基于规则的智能系统逐渐被基于深度学习的AI系统所替代。
AI技术是指机器学习(深度学习)和利用机器学习的元素技术(elementtechnology)。
机器学习是一种对输入数据的特征进行自主地分类/学习的算法技术。元素技术是一种利用诸如深度学习的机器学习算法的技术,并且包括诸如语言理解、视觉理解、推理/预测、知识表示和运动控制等技术领域。
AI技术被应用于如下的各种领域。语言理解是用于识别和应用/处理人类语言/字符的技术,并且包括自然语言处理、机器翻译、对话系统、查询响应、语音识别/合成等。推理预测是一种获取和逻辑地推断和预测信息的技术,并且包括基于知识/概率的推理、优化预测、基于偏好的规划、推荐等。知识表示是用于将人类体验信息自动处理成知识数据的技术,并且包括知识构建(数据生成/分类)、知识管理(数据利用)等。
发明内容
技术问题
当语音识别装置在存在包括语音的噪声的环境(例如看电视的环境)中操作时,因为现有的前端处理技术不能正确地操作(或者甚至不执行前端处理),存在语音识别装置的唤醒成功率显著恶化的问题。
技术方案
根据本公开的实施例,语音识别方法包括:接收第一多声道音频信号;从第一多声道音频信号中包括的每个声道音频信号中获取针对每个频带的语音信号特性和噪声信号特性;通过基于语音信号特性、噪声信号特性以及在一定时间之前获取的语音信号特性对所述第一多声道音频信号进行波束形成,生成具有经增强语音分量的信号;基于具有经增强语音分量的信号启用语音识别操作;对第二多声道音频信号进行语音识别并输出语音识别结果。
附图说明
从结合附图的以下描述中,本公开的某些实施例的上述和其它方面、特征和优点将变得更加明显,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080037110.9/2.html,转载请声明来源钻瓜专利网。