[发明专利]基于语义地生成的结果集合路由音频流在审
申请号: | 201811506330.2 | 申请日: | 2018-12-10 |
公开(公告)号: | CN110020423A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 穆尼尔·尼古拉·亚历山大·乔治;雅克布·诺维奇 | 申请(专利权)人: | 英特尔IP公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G10L25/30;G10L25/72 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宗晓斌 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结果集合 路由 语义 音频流 引擎 音频接收器 麦克风 口语理解 调度器 分类器 路由器 | ||
本公开涉及基于语义地生成的结果集合路由音频流。一种用于路由音频流的示例装置包括音频接收器,用于从麦克风接收音频。该装置还包括分类器,用于基于音频语义地生成结果集合。该装置还包括调度器,用于基于结果集合选择口语理解(SLU)引擎。该装置包括路由器,用于将音频路由到所选择的SLU引擎。
技术领域
本公开涉及用于基于语义地生成的结果集合路由音频流的装置、方法及系统。
背景技术
语音控制设备可以检测语音中的命令并基于命令执行动作。例如,语音控制设备可以包括智能咖啡机、音乐播放器、智能家庭助理和智能厨房抽油烟机。
发明内容
根据本公开的一个实施例,公开了一种用于路由音频流的装置,包括:音频接收器,用于从麦克风接收音频;分类器,用于基于音频语义地生成结果集合;调度器,用于基于结果集合选择口语理解(SLU)引擎;以及路由器,用于将音频路由到所选择的SLU引擎。
根据本公开的另一实施例,公开了一种用于路由音频流的方法,包括:经由处理器从麦克风接收音频;经由处理器基于音频语义地生成结果集合;经由处理器基于结果集合选择口语理解(SLU)引擎;以及经由处理器将音频路由到所选择的SLU引擎。
根据本公开的又一实施例,公开了一种用于路由音频流的系统,包括:用于从麦克风接收音频的装置;用于基于音频语义地生成结果集合的装置;用于基于结果集合选择口语理解(SLU)引擎的装置;以及用于将音频路由到所选择的SLU引擎的装置。
附图说明
图1是示出用于使用语义地生成的结果集合来路由音频流的示例系统的框图;
图2是示出用于使用语义地生成的结果集合来路由音频流的示例数据流的框图;
图3是示出用于使用语义地生成的结果集合来路由音频流的块的示例系统的详细示图;
图4是示出用于使用语义地生成的结果集合来路由音频流的方法的流程图;
图5是示出可以使用语义地生成的结果集合来路由音频流的示例计算设备的框图;以及
图6是示出存储用于使用语义地生成的结果集合来路由音频流的代码的计算机可读介质的框图。
在整个公开和附图中使用相同的标号来引用相同的组件和特征。100系列中的标号指最初在图1中找到的特征;200系列中的标号是指最初在图2中找到的特征;以此类推。
具体实施方式
如上所述,语音控制设备可以检测语音中的命令并基于命令执行动作。然而,同时使用两个或更多个语音控制设备可能导致一个或多个语音控制设备响应于命令的不需要的动作。单个命令可能引起来自两个或更多个设备的响应,即使它可能旨在针对其中一个设备。例如,所捕获的语音可以包括类似于两个或更多个设备上的两个或更多个命令的声音。
本公开总体涉及用于路由音频流的技术。具体地,本文描述的技术包括用于使用语义分析将音频流路由到语音控制设备的装置、方法和系统。示例装置包括音频接收器,用于从麦克风接收音频。该装置包括分类器,用于基于音频语义地生成结果集合。该装置还包括调度器,用于基于结果集合选择口语理解(spoken language understanding,SLU)引擎。如本文所使用的,SLU引擎是可以接收音频输入并输出具有一个或多个参数的动作或意图的装置。例如,SLU引擎可以输出“制作咖啡”或“音量:=50”。该装置还包括路由器,用于将音频路由到所选择的SLU引擎。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔IP公司,未经英特尔IP公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811506330.2/2.html,转载请声明来源钻瓜专利网。