[发明专利]基于接近度的语音启用特征在审
申请号: | 201880018428.5 | 申请日: | 2018-03-12 |
公开(公告)号: | CN110447070A | 公开(公告)日: | 2019-11-12 |
发明(设计)人: | S·萨加内格瓦达;L·亚玛迪奥;A·朱里德 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;李春辉 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音激活 接近度 分析数据 特征描述 用户偏好 用户状态 语音启用 传感器 | ||
描述了用于控制语音激活设备的语音激活特征的技术。接收来自一个或多个传感器的数据和指示用户状态的数据。基于分析数据,确定用户相对于语音激活设备的位置的接近度。至少部分地基于所确定的接近度、一个或多个规则以及一个或多个用户偏好,来启用语音激活设备的一个或多个语音激活特征。
背景技术
语音激活或语音命令设备越来越受欢迎。这样的设备由人声控制,从而允许用户操作设备,而无需用按钮或键来控制设备。该设备通常使用某种形式的声音识别接收和标识命令。
发明内容
描述了用于控制语音激活设备的语音激活特征的方法和系统。接收来自一个或多个数据源的指示用户的状态的数据。基于对数据的分析,基于多个可能位置的概率来选择用户的可能位置。确定相对于语音激活设备的位置的用户的可能接近度。接近度可以部分地基于计算状态信息和传感器的可用性而被确定。至少部分地基于所确定的接近度、一个或多个规则以及一个或多个用户偏好,来启用语音激活设备的一个或多个语音激活特征。
特征、功能和优点可以在各种实施例中独立地实现,或者可以在又一些其他实施例中组合,其进一步的细节可以参考以下描述和图示看出。
附图说明
图1是根据一个实施例的示例计算机环境的系统图。
图2是根据一个实施例的示例语音启用系统的框图。
图3是示出根据一个实施例的示例计算系统的操作模式和操作模式之间的示例转变的状态图。
图4是可以在各种实施例中使用的系统的图示。
图5是示出用于基于接近度来启用语音激活特征的示例操作集的流程图。
具体实施方式
本公开描述了用于基于用户与设备的接近度、通过使用语音识别和关键字检出来激活语音激活或语音命令设备的特征的技术和系统,实际上充当语音激活或语音命令设备的“按键通话”。在一些情况下,语音激活或语音命令设备可能被无意地激活,例如,由来自附近房间、电视或可能产生环境声音的其他语音源的语音无意地激活。当无意中被激活时,语音激活或语音命令设备可能造成不想要的动作,诸如打开或关闭设备,使门解锁或锁上,甚至从卖方网站订购物品。另外,由于环境噪声和其他因素,环境声音可能具有较低的保真度,因此语音识别可能是错误的,从而导致处理不正确或非预期的命令。
在本公开的一个实施例中,互连网络可以耦合到一个或多个用户计算设备以及数据源,诸如遍布家庭或办公室环境的传感器和计算设备。设备中的至少一个设备是语音激活设备。传感器可以包括光度传感器、被动红外(IR)传感器、具有图像识别的相机、深度传感器等。计算设备可以是可操作用于在互连网络上进行交互的任何其他设备。基于来自数据源的数据,语音激活设备可以关于用户相对于语音激活设备的位置和状态而做出确定。语音激活设备可以被配置为使得其仅在用户的位置和状态满足一个或多个标准时对语音命令做出响应。例如,语音激活设备可以仅在检测到用户处于距语音激活设备的指定半径内(诸如3英尺或5英尺)时对语音命令做出响应。当用户打算激活语音激活设备时,该距离可以与用户的预期接近度相关。
在另一示例中,语音激活设备可以仅在基于可用存在信息推断用户在指定位置内时对语音命令做出响应。可以使用推理逻辑从用户的计算设备、其他计算设备和可用传感器两者来推断用户的存在状态。传感器信息可以包括光模式和移动模式,并且用户设备信息可以包括蓝牙连接状态、计算设备活动或非活动等。推理逻辑可以在本地网络上的设备上执行,诸如语音激活设备或者网络中的另一设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880018428.5/2.html,转载请声明来源钻瓜专利网。