[发明专利]设备唤醒方法、装置、智能终端及设备唤醒系统在审
申请号: | 202111036612.2 | 申请日: | 2021-09-06 |
公开(公告)号: | CN113889101A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 宋士奇;汪进;毛跃辉 | 申请(专利权)人: | 珠海格力电器股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/32;G06N3/04;G06N3/08 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 涂凤琴 |
地址: | 519000*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 设备 唤醒 方法 装置 智能 终端 系统 | ||
本申请涉及一种设备唤醒方法、装置、智能终端及设备唤醒系统,设备唤醒方法包括获取每个设备接收的唤醒词对应声音能量值,计算每个设备与人员之间的距离信息,根据各个设备接收的唤醒词对应声音能量值和各个设备与人员之间的距离信息计算各个设备的响应分数,根据各个设备的响应分数确定最佳设备进行唤醒。本申请可以降低噪音对唤醒设备的影响,准确地判断出唤醒最佳设备进行唤醒,提升用户体验。
技术领域
本申请属于人工智能技术领域,具体涉及一种设备唤醒方法、装置、智能终端及设备唤醒系统。
背景技术
随着互联网技术的不断发展,以及远程控制技术的不断成熟,越来越多的移动终端已经支持网络唤醒设备的功能,即通过局域网实现设备的远程唤醒。随着语音智能设备的普及,家居环境中可能包括多个设备(如电视、冰箱、空调、洗衣机等)均由同一个唤醒词唤醒,这种场景下很有可能出现“一呼百应”的情况,例如,当用户通过固定唤醒词唤醒设备A的时候,设备A附近的其他设备B、C、D也响应了唤醒词,进而为用户后续的语音操作带来干扰,降低了用户的操控体验。
相关技术中,根据唤醒词时间段的信号能量选择最近设备,即声音传播距离越远,能量衰减越严重,则距离用户最近的设备所接收的唤醒词能量最大,由此根据能量选择最近设备。这种方法过分依赖于唤醒词时间段内的信号能量,在噪声环境下就近响应正确率将急剧下降,若某一设备离噪声源较近且离用户较远,则其唤醒词时间段内接收的噪声能量较多高于最近设备接收的信号能量而被误判为最近设备,出现唤醒设备出错,影响用户体验。
发明内容
为至少在一定程度上克服相关技术中根据唤醒词时间段的信号能量选择最近设备易出现唤醒出错,影响用户体验的问题,本申请提供一种设备唤醒方法、装置、智能终端及设备唤醒系统。
第一方面,本申请提供一种设备唤醒方法,包括:
获取每个设备接收的唤醒词对应声音能量值;
计算每个设备与人员之间的距离信息;
根据各个设备接收的唤醒词对应声音能量值和各个设备与人员之间的距离信息计算各个设备的响应分数;
根据各个设备的响应分数确定最佳设备进行唤醒。
进一步的,所述获取每个设备接收的唤醒词对应声音能量值,包括:
根据接收到的唤醒词对应声音绘制声音能量波形;
根据所述声音能量波形的幅度值确定声音能量值。
进一步的,所述计算每个设备与人员之间的距离信息,包括:
获取环境视频图像;
将所述环境视频图像输入预设人物目标识别模型得到人物目标判断结果;
若所述人物目标判断结果为存在人物目标,则获取人物目标框;
计算所述人物目标框在人物目标所在图像的占比得到设备与人员之间的距离信息。
进一步的,所述预设人物目标识别模型包括多个卷积层、多个瓶颈结构和多个连接层,所述将所述环境视频图像输入预设人物目标识别模型得到人物目标判断结果,包括:
将所述环境视频图像输入第一卷积层处理得到所述环境视频图像的浅层纹理信息;
将所述浅层纹理信息依次通过多个瓶颈结构后得到深层次图像特征;
将所述深层次图像特征进行上采样操作确定所述环境视频图像中感兴趣区域;
将所述感兴趣区域输入第一连接层与第二卷积层处理得到中间处理结果;
将所述中间处理结果再次进行上采样操作后输入第二连接层与第三卷积层处理,得到人物目标判断结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司,未经珠海格力电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111036612.2/2.html,转载请声明来源钻瓜专利网。