[发明专利]利用外部数据源重新识别语音有效
申请号: | 201611243688.1 | 申请日: | 2016-12-29 |
公开(公告)号: | CN107045871B | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 特雷弗·D·施特勒曼;约翰·沙尔克维克;格列布·斯科别利岑 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/187 | 分类号: | G10L15/187;G10L15/19;G10L15/26 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 外部 数据源 重新 识别 语音 | ||
提供了利用外部数据源重新识别语音。基于外部数据源改进语音识别的方法,包括在计算机存储介质上编码的计算机程序。在一个方面,方法包括:使用自动语音识别获得讲话的初始候选转录,并且基于该自动语音识别器在生成该初始候选转录时未使用的语言模型识别与出现在该初始候选转录中的一个或多个词语发音相似的一个或多个词语。附加的动作包括基于所识别的一个或多个词语生成一个或多个附加候选转录,并且从该候选转录中选择一个转录。所描述的特征可以使得来自外部数据源的数据能够在生成更为准确的转录时被使用而无需修改现有的自动语音识别器,或者可以避免自动语音识别器的重新编译。
技术领域
本说明书涉及到自动语音识别。
背景技术
语音识别是指使用自动语音识别器(ASR)将所讲出的词转录为文本。在传统的ASR系统中,所接收的音频被转换为计算机可读的声音,其随后可以与关联于给定语言的词词典进行比较。
发明内容
总体上,该说明书中所描述主题的一个创新方面能够以使用外部数据源改善语音识别的方法来体现。例如,一种自动语音识别器可以接收对讲话进行编码的音频数据并且使用第一语言模型提供该讲话的初始候选转录。该系统随后可以对该初始候选转录应用不同的第二语言模型以生成可替换候选转录,其(i)发音类似于初始候选转录,并且(ii)可能以给定语言所显现。该系统随后可以基于(i)该音频数据和候选转录之间的发音相似性以及(ii)该候选转录以给定语言出现的可能性而从候选转录中选择一个转录。
实施方式可以包括以下一个或多个特征。例如,在一些实施方式中,一种方法包括使用自动语音识别器获得讲话的初始候选转录,基于该自动语音识别器在生成该初始候选转录时未使用的语言模型识别与出现在该初始候选转录中的一个或多个词语发音相似的一个或多个词语,基于所识别的一个或多个词语生成一个或多个附加的候选转录,并且从该候选转录中选择一个转录。
其它多种版本包括相对应的被配置为执行在计算机存储设备上所编码的方法的动作的系统、计算机程序,以及被配置为使得计算装置执行该方法的动作的计算机程序。
一个或多个实施方式可以包括以下可选特征。例如,在一些实施方式中,该自动语音识别器在生成该初始候选转录时未使用的语言模型包括未处于该自动语音识别器在生成该初始候选转录时所使用的语言模型中的一个或多个词语。在一些方面,该自动语音识别器在生成该初始候选转录时未使用的语言模型以及该自动语音识别器在生成该初始候选转录时所使用的语言模型都包括一个或多个词语的序列,但是将该序列指示为具有不同的出现可能性。
在某些方面,该自动语音识别器在生成该初始候选转录时未使用的语言模型指示词或词序列出现的可能性。在一些实施方式中,动作包括针对每种候选转录确定反映该候选转录预期被说出的频繁程度的可能性分值,并且针对每个候选转录确定反映该候选转录与讲话之间的发音相似度的声音匹配分值,其中从候选转录中选择该转录是基于该声音匹配分值和可能性分值。在一些方面,确定反映该候选转录与讲话之间的发音相似度的声音匹配分值包括:从自动语音识别器获得子词声音匹配分值,识别与候选转录相对应的子词声音匹配分值的子集,并且基于与候选转录相对应的子词声音匹配分值的子集而生成该声音匹配分值。
在某些方面,确定反映该候选转录预期被说出的频繁程度的可能性分值包括基于该自动语音识别器在生成该初始候选转录时未使用的语言模型确定该可能性分值。在一些实施方式中,基于所识别的一个或多个词语生成一个或多个附加候选转录包括利用出现在初始候选转录中的一个或多个词语替代所识别的与出现在该初始候选转录中的一个或多个词语发音相似的一个或多个词语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611243688.1/2.html,转载请声明来源钻瓜专利网。