[发明专利]移动装置上的模态学习在审
申请号: | 202111185746.0 | 申请日: | 2017-09-29 |
公开(公告)号: | CN113900529A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 欧阳瑜;迭戈·米伦多·卡萨多;穆罕默迪纳穆尔·哈桑·谢科;弗朗索瓦丝·博费;德拉甘·齐夫科维奇;梅尔特姆·厄克泰姆 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F3/02 | 分类号: | G06F3/02;G06F40/232;G10L15/22 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;邓聪惠 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 移动 装置 学习 | ||
1.一种计算机实现的方法,包括:
由计算设备经由与所述计算设备相关联的第一用户输入模式接收特定词项的用户输入;
由所述计算设备生成与所述特定词项相关联的参数值,其中,所述参数值是基于与所述第一用户输入模式相对应的第一模态识别模型;
基于所述参数值来生成至少引用所述特定词项的输入场境数据结构;和
由所述计算设备向和与所述计算设备相关联的第二用户输入模式相对应的第二模态识别模型发送用于训练所述第二模态识别模型的所述输入场境数据结构。
2.根据权利要求1所述的方法,还包括:
由所述计算设备基于用户指示来确定所述特定词项的转录版本是否正确,其中,所述转录版本是基于所述第一模态识别模型。
3.根据权利要求1所述的方法,其中,所述第一模态识别模型与第一语言模型相对应,并且所述第二模态识别模型与第二语言模型相对应。
4.根据权利要求1所述的方法,其中,所述第一模态识别模型与语言模型相对应,并且所述第二模态识别模型与空间模型相对应。
5.根据权利要求1所述的方法,其中,所述第一用户输入模式与基于键盘的用户输入模式相对应,并且所述第二用户输入模式与基于语音的用户输入模式相对应。
6.根据权利要求5所述的方法,其中,所述基于语音的用户输入模式与基于云的自动言语识别器相关联。
7.根据权利要求5所述的方法,其中,所述基于语音的用户输入模式与声学模型相关联,所述声学模型被配置为将发音直接与转录的词相匹配。
8.根据权利要求1所述的方法,还包括:
由所述计算设备接收将所述计算设备从所述第一用户输入模式切换到所述第二用户输入模式的用户指示;和
响应于所述用户指示,从所述第一用户输入模式切换到所述第二用户输入模式。
9.根据权利要求1所述的方法,还包括:
由所述计算设备在从所述第一模态识别模型接收所述输入场境数据结构之前,经由与所述计算设备相关联的所述第二用户输入模式接收包括所述特定词项的第二用户输入;
响应于所述第二模态识别模型未识别所述特定词项,提供错误转录的词项以供由所述计算设备显示;和
由所述计算设备在从所述第一模态识别模型接收所述输入场境数据结构之后,所述特利用定词项的正确版本的显示来替换所述错误转录的词项的所述显示。
10.根据权利要求1所述的方法,其中,所述第一用户输入模式与基于语音的用户输入模式相对应,并且所述方法还包括:
基于声学模型来生成所述特定词项的文本版本。
11.根据权利要求10所述的方法,还包括:
向所述用户提供所述特定词项的所述文本版本以供由所述计算设备显示;和
由所述计算设备接收所述特定词项的所述文本版本是所述特定词项的正确版本的用户指示。
12.根据权利要求1所述的方法,还包括:
由所述计算设备经由所述第二用户输入模式接收包括第二词项的第二用户输入;
响应于所述第二模态识别模型未识别所述第二用户输入,提供所述第二模态识别模型与所述第二词项相关联的错误转录的词项作为最高识别假设以供由所述计算设备显示;
在所述计算设备提供所述错误转录的词项以供显示之后,由所述计算设备接收将所述计算设备从所述第二用户输入模式切换到所述第一用户输入模式的用户指示;
在所述计算设备已经从所述第二用户输入模式切换到所述第一用户输入模式之后由所述计算设备接收提供所述错误转录的词项的校正的第三用户输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111185746.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视频图像处理方法与装置
- 下一篇:一种山区雷击定位方法及装置