[发明专利]通过语音命令的基于位置的语音识别系统有效
申请号: | 201880092326.8 | 申请日: | 2018-02-13 |
公开(公告)号: | CN112236815B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 白承敏;孙胜培 | 申请(专利权)人: | 乐思罗博股份有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/22;G10L15/28;H04W4/02;H04L67/12;G06F3/16;G01S3/803;G01S5/18 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 王玉双;张燕华 |
地址: | 韩国首尔市瑞*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 语音 命令 基于 位置 识别 系统 | ||
根据本发明,其目的在于,在包括麦克风在内的多个装置通过传感器网络连接的情况下,容易地识别使用者的语音命令。掌握各装置的相对位置,通过语音命令接入的时间差异来追踪使用者的位置及方向。基于使用者的位置及方向,执行该命令的解析。这种方法作为用于传感器网络(Sensor Network)、物物通信(Machine to Machine:M2M)、机器类型通讯(Machine Type Communication:MTC)、物联网(Internet of Things:IoT)的方法,可以用于智能型服务(智能家庭、智能楼宇等)、数字教育、安保及安全相关服务等。
技术领域
本发明涉及通过语音命令的位置追踪及基于位置的语音识别系统,特别是涉及一种在包括麦克风在内的多个装置以传感器网络连接的情况下容易地识别使用者语音命令的位置追踪装置及基于位置的语音识别服务。本研究是作为产业通商资源部事业化衔接技术开发项目获得支援的研究。
背景技术
最近,通过语音命令来控制多样设备的技术正在逐渐普遍化。特别是语音命令的应用正在扩散到冰箱、TV等家电设备或照明等多样装置。但是,随着语音命令应用的扩散,发生使用者不希望的动作的可能性也渐渐提高。在多个设备使用相同语音命令的情况下,例如在诸如打开开关的动作等多个设备通过相同语音命令的发话而运转的情况下,在并非使用者所希望的设备会出现意外动作的可能性增大。
为了解决这种问题,现有技术使用通过照相机或红外线光标来掌握使用者的视线的方法(美国专利第9825773号、美国专利第6970824号),或利用在同一设备内安装多个麦克风来推定声源方向的方法(美国专利第9554208号)。
在如现有技术所示利用照相机或红外线光标的情况下,或在同一设备内安装多个麦克风的情况下,由于需要追加的传感器,因而从制造厂商立场而言,费用负担大,体现多种传感器设备所需的开发负担也大。
因此,迫切要求开发一种技术,能够在下达语音命令时掌握使用者的意图,通过语音来控制希望的设备的希望的动作。
发明内容
为了解决上述问题,本发明旨在提供一种能够利用多个麦克风来决定使用者的发话方向,对处在所决定的发话方向范围内的命令对象设备进行特定的基于位置的语音识别服务。
特别是本方法的目的在于,在包括麦克风在内的多个装置通过传感器网络连接的情况下,容易地识别使用者的语音命令。因此,掌握成为语音命令对象的各装置的相对位置,通过语音命令接入的时间差异来追踪使用者的位置及方向。基于使用者的位置及方向,执行该命令的解析。
为了解决所述技术课题,本发明的基于位置的语音识别系统可以包括:分别包括至少一个麦克风的多个语音命令接收装置;及传感器网络控制装置,所述传感器网络控制装置通过传感器网络而与所述多个语音命令接收装置连;所述传感器网络控制装置可以包括:传感器位置决定部,所述传感器位置决定部决定所述多个语音命令接收装置的相对位置;使用者位置演算部,所述使用者位置演算部基于所述相对位置来演算使用者的位置;发话方向演算部,所述发话方向演算部基于所述多个语音命令接收装置各自的语音大小,演算换算语音大小,基于换算语音大小来决定所述使用者的发话方向范围;及对象装置选定部,所述对象装置选定部根据所述发话方向范围,选定所述多个语音命令接收装置中成为语音命令对象的对象语音命令接收装置;所述换算语音大小可以是假定所述多个语音命令接收装置处于距所述使用者相同距离时的语音大小。
此时,所述发话方向演算部可以利用声音衰减模型求出所述多个语音命令接收装置各自的语音大小后,基于所述多个语音命令接收装置各自的语音大小,演算换算语音大小。
现有技术作为用于类推发话方向的方法,使用使用者的视线或追加的照相机或红外线光标等。这种追加设备存在费用负担、体现及使用的困难等缺点。但是,本发明利用接收语音命令的麦克风,基于使用者的位置而容易地掌握意图。另外,本发明不仅利用使用者位置信息,还可以利用下达命令的发话方向信息,向使用者提供进一步提高的服务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐思罗博股份有限公司,未经乐思罗博股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880092326.8/2.html,转载请声明来源钻瓜专利网。