[发明专利]学习个性化实体发音有效
申请号: | 201611243235.9 | 申请日: | 2016-12-29 |
公开(公告)号: | CN107039038B | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 安托万·让·布吕盖;彭福春;弗朗索瓦丝·博费 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/187 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及学习个性化实体发音。本公开提供了方法、系统和设备,其包括在计算机存储介质上被编码的用于实施发音字典的计算机程序。所述方法包括:接收与包括命令和实体名称的讲话对应的音频数据。另外,所述方法可以包括:通过自动语音识别器,生成对所述音频数据中与所述实体名称相关联的部分的初始转录,接收对所述讲话中与所述实体名称相关联的所述部分的修正转录,获取与所述音频数据中与所述实体名称相关联的所述部分相关联的音标发音,对发音字典进行更新以将所述音标发音与所述实体名称相关联,接收包括所述实体名称的后续讲话,以及至少部分地基于更新后的发音字典来对所述后续讲话进行转录。可以提供改进的语音识别和更高质量的转录。 | ||
搜索关键词: | 学习 个性化 实体 发音 | ||
【主权项】:
一种方法,其包括:接收与包括命令和实体名称的讲话对应的音频数据;通过自动语音识别器,生成所述音频数据中与所述实体名称相关联的部分的初始转录;接收所述讲话中与所述实体名称相关联的所述部分的、与所述初始转录不同的修正转录;响应于接收到所述修正转录,获取与所述音频数据中与所述实体名称相关联的所述部分相关联的音标发音;对发音字典进行更新以将所述音标发音与所述实体名称相关联;接收包括所述实体名称的后续讲话;以及至少部分地基于更新后的发音字典来对所述后续讲话进行转录。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611243235.9/,转载请声明来源钻瓜专利网。