[发明专利]通过计算设备检测持续对话在审
申请号: | 201980043222.2 | 申请日: | 2019-02-27 |
公开(公告)号: | CN112334979A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 纳森·大卫·霍华徳;加博尔·希姆科;安德烈·久尔久;贝沙德·贝扎迪;马尔钦·M·诺瓦克-普日戈兹基 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/18;G06F3/16;G10L15/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李佳;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 计算 设备 检测 持续 对话 | ||
公开了用于检测持续对话的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。在一个方面,一种方法包括接收第一话语的第一音频数据的动作。动作进一步包括获得第一话语的第一转录。动作进一步包括接收第二话语的第二音频数据。动作进一步包括获得第二话语的第二转录。动作进一步包括基于对第二转录和第一转录或对第一查询的响应的分析,确定第二话语是否包括针对查询处理系统的查询。动作进一步包括配置数据路由组件以将第二话语的第二转录作为第二查询提供给查询处理系统或绕过路由第二转录。
技术领域
本说明书通常涉及自然语言处理。
背景技术
自然语言处理与计算机和人类语言之间的交互有关,尤其是如何对计算机进行编程以处理和分析自然语言数据。自然语言处理可能涉及语音识别,这是使计算机能够将口头语言识别和转变成文本的计算语言学的领域。
发明内容
当用户希望与设备交互时,用户可以按下设备上的按钮,触摸设备的屏幕或对设备讲话。通过按下设备上的按钮或触摸设备的屏幕,清楚的是,用户正在与设备进行交互。但是,当用户通过对设备讲话来进行交互时,可能尚不清楚语音是否意在作为设备的输入。由于这种歧义,一些设备被配置成检测用户何时讲出热词。该热词充当用户正在将跟随该热词的语音指向设备的从用户到设备的信号。例如,如果用户只说“how old is BarackObama(巴拉克·奥巴马多大年纪)”,则设备的麦克风可能会检测到用户的语音,但可能不会执行任何动作,因为话语之前没有热词。如果相反,用户说“ok computer,how old isBarack Obama(好的计算机,巴拉克·奥巴马多大年纪)”,该设备检测到“ok computer(好的计算机)”的热词,并确定“how old is Barack Obama”意在作为该设备的输入,因此设备会响应并执行适当的动作。
在用户跟进对该设备的附加口头请求的情况下,用户在意在用于该设备的每个语句(statement)之前继续说出该热词可能会很尴尬。例如,用户最初可能会说:“okcomputer,how old is Barack Obama”,然后跟进“ok computer,how tall is BarackObama(好的计算机,巴拉克·奥巴马有多高)”和“ok computer,where was he born(好的计算机,他在哪里出生)”。如果用户能够继续与设备进行交互而不必每次都说热词“okcomputer”,那将是更自然的。但是,在每个请求之前都没有热词的情况下,许多设备将无法检测到话语作为输入,因为这些设备无法确定用户正在对该设备讲话。
为了解决此问题,设备可以被配置成确定后续话语(例如,用户在与设备的对话中来自用户的第二或后续请求)是否意在用于设备,即使该用户不包括后续话语中的热词。遵循上面的示例,用户最初可能会说:“ok computer,how old is Barack Obama”,并且然后来自于设备的响应跟进“how tall is Barack Obama(巴拉克·奥巴马有多高)”,并且进一步“where was he born(他在哪里出生)”。除了其他信号之外,该设备还可以分析后续话语的内容,以确定该后续话语是意在用于该设备或者是否该用户是否正在对其他人讲话。
例如,设备可以将后续话语的词项与初始话语的词项进行比较。如果这些词项匹配或足够相关,则设备可以确定用户意在对该设备进行后续话语。该设备可以考虑该设备的屏幕的内容、该设备的位置、当前时间和/或意在用于该设备的用户先前的话语以确定用户是否意在对该设备进行后续话语。如果设备确定后续话语意在用于该设备,则该设备将根据话语的转录执行动作。如果设备确定后续话语不意在用于该设备,则该设备将不采取任何行动。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980043222.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于记录三维图像的SMI传感器的VCSEL装置
- 下一篇:多用途液压系统