[发明专利]基于图像识别的语音唤醒方法及装置、电子设备在审
申请号: | 202211415629.3 | 申请日: | 2022-11-11 |
公开(公告)号: | CN115938366A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 胡晟;李宾;郑珊珊 | 申请(专利权)人: | 深圳创维-RGB电子有限公司 |
主分类号: | G10L15/24 | 分类号: | G10L15/24;G10L15/22;H04L12/28;G06V40/10;G06T7/70 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 王晓玲 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图像 识别 语音 唤醒 方法 装置 电子设备 | ||
本发明公开了一种基于图像识别的语音唤醒方法及装置、电子设备。其中,该方法包括:在图像采集模块启动的情况下,利用图像采集模块采集目标对象的图像;对图像进行图像识别处理,得到识别结果;在基于识别结果确定需要启动智能家电的语音唤醒功能时,启动智能家电设备的语音接收功能。本发明解决了相关技术中仅能采用语音方式来启动与智能家电设备的对话,方式比较单一,无法满足用户需求的技术问题。
技术领域
本发明涉及自然语音处理技术领域,具体而言,涉及一种基于图像识别的语音唤醒方法及装置、电子设备。
背景技术
当下语音控制在智能家电设备的应用比较常见,例如,电视作为家庭智能设备,语音控制的普及率已经非常高。但是,当前语音控制的交互,都需要使用唤醒词,唤醒词还存在识别率比较低,或者误唤醒率比较高的问题。并且在一些场景下也会存在一些不方便进行采用语音交互的方式启动对话的问题,例如,部分用户并不知晓如何采用语音对话方式来启动语音交互。
针对上述相关技术中仅能采用语音方式来启动与智能家电设备的对话,方式比较单一,无法满足用户需求的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于图像识别的语音唤醒方法及装置、电子设备,以至少解决相关技术中仅能采用语音方式来启动与智能家电设备的对话,方式比较单一,无法满足用户需求的技术问题。
根据本发明实施例的一个方面,提供了一种基于图像识别的语音唤醒方法,应用于智能家电设备,所述智能家电设备包括图像采集模块,包括:在所述图像采集模块启动的情况下,利用所述图像采集模块采集目标对象的图像;对所述图像进行图像识别处理,得到识别结果;在基于所述识别结果确定需要启动所述智能家电的语音唤醒功能时,启动所述智能家电设备的语音接收功能。
可选地,该基于图像识别的语音唤醒方法还包括:对所述图像采集设备进行初始化设定;其中,对所述图像采集设备进行初始化设定,包括:向所述目标对象发送提示信息,其中,所述提示信息包括以下至少之一:所述目标对象相对于所述智能家电设备需要进行的距离调整值,所述目标对象的头部相对于所述智能家电设备需要进行的头部角度调整值,所述目标对象的视线相对于所述智能家电设备需要进行的角度调整值;在确定所述目标对象完成所述提示信息对应的操作后,完成对所述图像采集设备的初始化。
可选地,该基于图像识别的语音唤醒方法还包括:响应启动指令,启动所述图像采集模块。
可选地,该基于图像识别的语音唤醒方法还包括:生成所述启动指令;其中,生成所述启动指令,包括以下至少之一:在确定启动时间到来时,生成所述启动指令,其中,所述启动时间基于历史启动数据生成,所述历史启动数据包括历史时间段内所述图像采集模块的历史启动时刻;在接收到语音启动信息时,生成所述启动指令。
可选地,该基于图像识别的语音唤醒方法还包括:获取所述历史时间段内所述图像采集模块的多个历史启动时刻;对所述多个历史启动时刻执行预定操作,得到所述启动时间。
可选地,对所述多个历史启动时刻执行预定操作,得到所述启动时间,包括:将所述多个历史启动时刻转换为时间确定模型的输入,得到转换结果,其中,所述时间确定模型为预先基于多组训练数据通过机器学习训练得到;将所述转换结果输入至所述时间确定模型,并获取所述时间确定模型的输出结果;将所述输出结果转换为所述启动时间。
可选地,对所述多个历史启动时刻执行预定操作,得到所述启动时间,包括:对所述多个历史启动时刻进行线性拟合处理,得到所述启动时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳创维-RGB电子有限公司,未经深圳创维-RGB电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211415629.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序