[发明专利]使用关键语句适应性地识别语音在审
申请号: | 202010980904.0 | 申请日: | 2020-09-17 |
公开(公告)号: | CN112927678A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 克尔兹托夫·查诺夫斯基;穆尼尔·尼古拉·亚历山大·乔治;托比亚斯·博克雷;乔治·施特默尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/26;G10L15/16;G10L15/187 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 李丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 关键 语句 适应性 识别 语音 | ||
本公开涉及使用关键语句适应性地识别语音。一种用于识别语音的示例装置包括音频接收器,用于接收音频流。该装置还包括关键语句检测器,用于检测音频流中的关键语句。该装置还包括模型适配器,用于基于检测到的关键语句来动态地适配模型。该装置还包括查询识别器,用于通过经适配的模型来检测音频流中跟随在关键语句之后的声音查询。
技术领域
本公开涉及人工智能领域,更具体地,涉及使用关键语句适应性地识别语音。
背景技术
语音识别器用于检测音频中的语句。例如,语句可以包括可用于执行一个或多个任务的命令。
发明内容
根据本公开的一方面,提供了一种装置。该装置包括:音频接收器,音频接收器用于接收音频流;关键语句检测器,关键语句检测器用于检测音频流中的关键语句;模型适配器,模型适配器用于基于关键语句来动态地适配模型;以及查询识别器,查询识别器用于通过该模型来检测音频流中跟随在关键语句之后的声音查询。
根据本公开的另一方面,提供了一种方法。该方法包括:经由处理器接收音频流;经由处理器检测音频流中的关键语句;经由处理器基于关键语句来动态地适配模型;以及经由处理器通过该模型来检测音频流中跟随在关键语句之后的声音查询。
根据本公开的另一方面,提供了一种计算机可读存储设备。该存储设备包括指令,所述指令当被执行时,使得一个或多个处理器至少检测音频流中的关键语句;基于关键语句来动态地适配模型;并且通过该模型来检测音频流中跟随在关键语句之后的声音查询。
根据本公开的另一方面,提供了一种设备。该设备包括:用于接收音频流的装置;用于检测音频流中的关键语句的装置;用于基于关键语句来动态地适配模型的装置;以及用于通过该模型来检测音频流中跟随在关键语句之后的声音查询的装置。
附图说明
图1是示出用于利用适应性语音识别进行口语理解的示例系统的框图;
图2是示出示例适应性语音识别器的框图;
图3是示出用于语音语句适应性语音识别的示例过程的时序图;
图4是示出利用超低功率声音唤醒(wake-on-voice)的示例适应性语音识别器的框图;
图5是示出利用超低功率声音唤醒进行适应性语音识别的示例过程的时序图;
图6是示出使用关键语句来适应性地识别语音的方法的流程图;
图7是示出可以使用关键语句来适应性地识别语音的示例计算设备的框图;以及
图8是示出存储用于适应性关键语句语音识别的代码的计算机可读介质的框图。
本公开和附图通篇使用相同的数字来指代相似的组件和特征。100系列中的数字是指最初在图1中找到的特征;200系列中的数字是指最初在图2中找到的特征;以此类推。
具体实施方式
语音识别器可以在由许多人记录的巨大音频语料库上被训练。这样的语音识别器可以识别在类似的声学环境中讲话的类似的人。然而,不同的声学环境或具有显著不同声音的人可导致降低的识别精度。例如,背景噪声可导致精度降低的识别结果。
本公开总体上涉及使用关键语句来适应性地识别语音的技术。例如,关键语句可以是通过声音唤醒而检测到的唤醒词,或者是更容易识别的预选语句。具体地,本文中描述的技术包括用于使用关键语句来适应性地识别语音的装置、方法和系统。示例装置包括音频接收器,用于接收音频流。该装置还包括关键语句检测器,用于检测音频流中的关键语句。该装置还包括模型适配器,用于基于检测到的关键语句来动态地适配模型。该装置还包括查询识别器,用于通过经适配的模型来检测音频流中跟随在关键语句之后的声音查询。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010980904.0/2.html,转载请声明来源钻瓜专利网。