[发明专利]基于位置标记的语音识别模型有效
申请号: | 201380040775.5 | 申请日: | 2013-07-23 |
公开(公告)号: | CN104509079B | 公开(公告)日: | 2017-06-09 |
发明(设计)人: | G·陶布曼;B·斯特罗普 | 申请(专利权)人: | 谷歌公司 |
主分类号: | H04M1/725 | 分类号: | H04M1/725;G10L15/30;G10L15/183;G10L15/22 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 酆迅 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开了用于使用模型执行语音识别的方法、系统和包括编码在计算机存储介质上的计算机程序的装置,该模型基于其中说话者做出话语的建筑物内的位置。所述方法、系统和装置包括接收对应于话语的数据和获得用于其中话语被说出的建筑物内的区域的位置标记的动作。进一步的动作包括基于位置标记选择用于语音识别的一个或多个模型,其中每个所选择的一个或多个模型与基于位置标记的权重相关联。此外,动作还包括使用所选择的一个或多个模型和所选择的一个或多个模型的相应权重生成复合模型。所述动作还包括使用复合模型生成话语的转录。 | ||
搜索关键词: | 基于 位置 标记 语音 识别 模型 | ||
【主权项】:
一种用于处理语音的计算机实现的方法,包括:在处理系统处接收对应于话语的数据;在所述处理系统处获得用于其中所述话语被说出的建筑物内的区域的位置标记;在所述处理系统处基于所述位置标记来确定可能性集合,所述集合中的每个可能性对应于所述话语在来自所述建筑物的多个候选区域中的所述建筑物的特定区域被说出的可能性;在所述处理系统处基于所述可能性集合来从所述建筑物的所述多个候选区域选择所述建筑物的一个或者多个候选区域;针对所述建筑物的每个选择的候选区域,访问与所述建筑物的每个相应的候选区域相关联的用于语音识别的模型;在所述处理系统处使用访问的所述用于语音识别的模型以及与所述建筑物的对应的候选区域相关联的所述可能性来生成复合模型;以及在所述处理系统处使用所述复合模型来生成所述话语的转录。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201380040775.5/,转载请声明来源钻瓜专利网。