[发明专利]语音唤醒方法、装置及智能设备有效
申请号: | 201810392243.2 | 申请日: | 2018-04-27 |
公开(公告)号: | CN108538293B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 张利红 | 申请(专利权)人: | 海信视像科技股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 266555 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 唤醒 方法 装置 智能 设备 | ||
本申请提供一种语音唤醒方法、装置及智能设备,方法包括:通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词;在判定为否时,通过预先训练的通用唤醒模型判定输入语音是否为目标唤醒词;若是,执行唤醒;其中,用户唤醒模型是利用用户录制的唤醒语音构建的模型,通用唤醒模型是利用收集的唤醒语料训练得到的模型。由于本申请在通用唤醒模型基础上,增加的用户唤醒模型是利用使用者录制的唤醒语音构建的模型,因此在使用产品时,大部分情况通过该模型可成功唤醒,若通过该模型无法成功唤醒,再通过通用唤醒模型判定,以确保成功唤醒。从而本申请通过用户唤醒模型和通用唤醒模型的结合可以提高唤醒率,提升用户的使用体验。
技术领域
本申请涉及语音处理技术领域,尤其涉及一种语音唤醒方法、装置及智能设备。
背景技术
在智能家居或者语音交互系统中,语音唤醒技术应用非常广泛。但由于语音唤醒效果不佳和运算量大的问题,降低了用户实际应用体验,并且也提高了对硬件设备的要求。
在相关技术中,通常利用关键词识别来实现语音唤醒,即用户输入语音后,通过预先训练得到的基于神经网络的模型,识别输入语音的关键词,进而根据识别出的关键词实现唤醒功能。然而,对于用户来说,发音差距(例如带有方言的发音)比较大,训练得到的模型很难确保每一用户的唤醒语音都能达到理想的效果,因此总有一些用户输入的语音无法实现唤醒,从而造成唤醒率低的问题。
发明内容
有鉴于此,本申请提供一种语音唤醒方法、装置及智能设备,以解决现有唤醒方式唤醒率低的问题。
根据本申请实施例的第一方面,提供一种语音唤醒方法,所述方法包括:
通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词;
在判定为否的情况下,通过预先训练的通用唤醒模型判定所述输入语音是否为目标唤醒词;
若是,则执行唤醒;
其中,所述用户唤醒模型是利用用户录制的唤醒语音构建的模型,所述通用唤醒模型是利用收集的唤醒语料训练得到的模型。
根据本申请实施例的第二方面,提供一种语音唤醒装置,所述装置包括:
第一判定单元,用于通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词;
第二判定单元,用于在判定为否的情况下,通过预先训练的通用唤醒模型判定所述输入语音是否为目标唤醒词;
唤醒单元,用于在判定为是时,执行唤醒;
其中,所述用户唤醒模型是利用用户录制的唤醒语音构建的模型,所述通用唤醒模型是利用收集的唤醒语料训练得到的模型。
根据本申请实施例的第三方面,提供一种智能设备,所述设备包括:
语音采集模块,用于采集输入语音;
存储器,用于存储语音唤醒的控制逻辑对应的机器可读指令;
处理器,用于读取所述存储器上的所述机器可读指令,并执行所述指令以实现如下操作:
通过预设的用户唤醒模型判定接收到的输入语音是否为目标唤醒词;
在判定为否的情况下,通过预先训练的通用唤醒模型判定所述输入语音是否为目标唤醒词;
若是,则执行唤醒;
其中,所述用户唤醒模型是利用用户录制的唤醒语音构建的模型,所述通用唤醒模型是利用收集的唤醒语料训练得到的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信视像科技股份有限公司,未经海信视像科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810392243.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法、装置、设备及可读存储介质
- 下一篇:一种语音交互方法及装置