[发明专利]基于词比较的语音端点定位有效
申请号: | 201510195100.9 | 申请日: | 2015-04-22 |
公开(公告)号: | CN105006235B | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | M·布坎南;P·K·古普塔;C·B·坦迪奥诺 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L15/08;G10L15/26 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 比较 语音 端点 定位 | ||
本发明的各实施例涉及基于词比较的语音端点定位。描述了用于基于词比较的语音端点定位的方法、系统以及包括编码在计算机存储介质上的计算机程序的装置。在一个方面,一种方法包括获得话语的转录的动作。动作进一步包括将文本样本的汇集中的(i)包括与转录匹配的词语并且(ii)不包括任何附加的词语的文本样本的数量确定为第一值。动作进一步包括将文本样本的汇集中的(i)包括与转录匹配的词语并且(ii)包括一个或者多个附加的词语的文本样本的数量确定为第二值。动作进一步包括至少基于比较第一值与第二值来将话语分类为很可能不完整的话语或者非很可能不完整的话语。
本申请要求于2014年4月23日提交的、申请号为61/983,025的美国专利申请的权益,其内容通过引用并入。
技术领域
本公开内容总体上涉及语音识别,并且一个特定实现方式涉及对语音进行端点定位(endpointing)。
背景技术
自然语言处理系统通常使用端点器(endpointer)来确定用户何时开始以及结束说话。一些传统的端点器在确定话语何时开始或者结束时对词之间的停顿的持续时间进行评价。例如,如果用户说“what is长停顿for dinner”,则传统的端点器可以在长停顿处分割话音输入,并且可以指令自然语言处理系统尝试处理不完整的短语“what is”,而不是处理完整的短语“what is for dinner”。如果端点器为话音输入指定了错误的开始点或者结束点,则使用自然语言处理系统处理语音的结果可能是错误的或者不符合需要的。
发明内容
根据在本说明书中所描述的主题内容的创新的方面,一种计算设备可以接收由用户说出的话语的话音输入,并且可以使用连续语音识别器来递增地转录话语。计算设备比较递增地识别的转录与来自文本样本的汇集(诸如,由其他用户之前提交给搜索引擎的搜索查询的汇集)中的文本样本进行比较,以确定转录更可能表示完整的查询还是不完整的查询。
根据一个方式,确定转录更可能表示完整的查询还是不完整的查询包括:确定与转录匹配并且不包括任何附加的词语(term)的文本样本的数量,并且确定与转录匹配并且包括一个或者多个附加的词语的文本样本的数量。计算设备可以然后基于那两个数量确定比率并且比较确定的比率与阈值比率。如果确定的比率不满足阈值比率,则计算设备将话语分类为很可能不完整的话语。如果确定的比率满足阈值比率,则计算设备将话语分类为非很可能不完整的话语。
基于将话语分类为很可能完整的话语或者不完整的话语,设备可以对话音输入进行端点定位,或者可以去激活麦克风或者将麦克风维持在激活状态。如果话语被分类为很可能不完整的话语,则设备可以将麦克风维持在激活状态以接收附加的话语,或者可以在对话音输入进行端点定位之前进一步等待。如果话语被分类为非很可能不完整的话语,则设备可以去激活麦克风并且处理话语,或者可以在对话音输入进行端点定位之前不进行进一步等待。
一般来说,在本说明书中所描述的主题内容的另一个创新的方面可以被实施为方法,这些方法包括以下动作:获得话语的转录;将文本样本的汇集中的(i)包括与转录匹配的词语并且(ii)不包括任何附加的词语的文本样本的数量确定为第一值;将文本样本的汇集中的(i)包括与转录匹配的词语并且(ii)包括一个或者多个附加的词语的文本样本的数量确定为第二值;并且至少基于比较第一值与第二值来将话语分类为很可能不完整的话语或者非很可能不完整的话语。
这些和其他实施例可以各自可选地包括以下特征中的一个或者多个特征。将文本样本的汇集中的(i)包括与转录匹配的词语并且(ii)不包括任何附加的词语的文本样本的数量确定为第一值的动作包括:在每个文本样本中确定与转录匹配的词语以与在转录中相同的顺序出现。将文本样本的汇集中的(i)包括与转录匹配的词语并且(ii)包括一个或者多个附加的词语的文本样本的数量确定为第二值的动作包括:在每个文本样本中确定与转录匹配的词语在每个文本样本的前缀处出现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510195100.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:磁记录头和具有该磁记录头的盘装置
- 下一篇:一种调节屏幕亮度的方法及智能手表