[发明专利]使用神经网络模型进行选择性唤醒词检测的系统和方法在审
申请号: | 201980003798.6 | 申请日: | 2019-09-25 |
公开(公告)号: | CN111247582A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 约阿希姆·范伯格;丹妮亚·贾科贝洛;克劳斯·哈顿 | 申请(专利权)人: | 搜诺思公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 陈慧 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 神经网络 模型 进行 选择性 唤醒 检测 系统 方法 | ||
用于通过媒体回放系统进行媒体回放的系统和方法包括:通过网络麦克风设备捕获声音数据,以及识别该声音数据中的候选唤醒词。基于对该声音数据中候选唤醒词的识别,系统从多个唤醒词引擎中选择第一唤醒词引擎。通过第一唤醒词引擎,系统分析该声音数据以检测确认的唤醒词,并且响应于检测确认的唤醒词,向一个或多个与语音助手服务相关联的远程计算设备发送该声音数据的语音发声。
相关申请的交叉引用
本申请要求于2018年9月28日提交的美国专利申请No.16/145,275的优先权,其全部内容通过引用并入本文。
技术领域
本技术涉及消费品,并且更具体地,涉及针对语音可控媒体回放系统或其一些方面的方法、系统、产品、特征、服务和其他元素。
背景技术
访问和收听外放设置中的数字音频的选项是有限的,直到2003年SONOS公司申请了其首批专利申请中的一件题为“Method for Synchronizing Audio Playback betweenMultiple Networked Devices(用于在多个联网设备之间同步音频播放的方法)”的专利申请,并在2005年开始出售媒体回放系统。SONOS无线高保真(HiFi)系统使人们可以通过一个或多个联网回放设备体验来自许多源的音乐。通过安装在智能电话、平板计算机或计算机上的软件控制应用,人们能够在具有联网回放设备的任何房间中播放他或她期望的内容。另外,使用控制器,例如,能够将不同的歌曲流传输到具有回放设备的每个房间,能够将房间组合在一起进行同步回放,或者可以在所有房间中同步收听相同的歌曲。
鉴于对数字媒体的兴趣日益增长,仍然需要开发一种消费者易于使用的技术以进一步增强收听体验。
附图说明
参考以下说明书、所附权利要求和附图,可以更好地理解所公开的技术的特征、方面和优点,在附图中:
图1A是具有根据所公开技术的方面配置的媒体回放系统的环境的局部剖视图;
图1B是图1A的媒体回放系统和一个或多个网络的示意图;
图2A是示例回放设备的功能框图;
图2B是图2A的回放设备的示例外壳的立体图;
图3A-3E是示出了根据本公开的方面的示例回放设备配置的图;
图4A是根据本公开的方面的示例控制器设备的功能框图;
图4B和图4C是根据本公开的方面的控制器接口;
图5是根据本公开的方面的示例网络麦克风设备的某些组件的功能框图;
图6A是示例语音输入的图;
图6B是描绘根据本公开的方面的示例声音样本的图;
图7是根据本公开的方面的用于两阶段唤醒词检测的示例方法的流程图;
图8是根据本公开的方面的用于生成关键词发现和选择模型的系统的功能框图;
图9是示出了根据本公开的方面的在压缩之前和压缩之后经由软权重共享的神经网络模型的权重的对数权重分布的图;以及
图10示出了根据本公开的方面的神经网络模型的压缩稀疏行表示的示例。
附图是出于说明示例实施例的目的,但是应当理解的是,本发明不限于附图中所示的布置和手段。在附图中,相同的附图标记标识至少大致相似的元件。为了促进对任何特定元件的讨论,任何参考数字中的一个或多个最高有效位指的是首次引入该元件的附图。例如,首先参照图1A介绍和讨论元件103a。
具体实施方式
I.概述
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于搜诺思公司,未经搜诺思公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980003798.6/2.html,转载请声明来源钻瓜专利网。