[发明专利]模块化深度学习模型有效
申请号: | 201780014729.6 | 申请日: | 2017-02-27 |
公开(公告)号: | CN108701453B | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | Y·黄;刘朝军;K·库玛;K·P·卡尔高卡;龚一凡 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L15/065 | 分类号: | G10L15/065;G06N3/045;G10L15/16 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本文中描述的技术使用模块化模型来处理语音。基于深度学习的声学模型包括不同类型的神经网络层的堆叠。基于深度学习的声学模型的子模块可以用于表示不同的非音素的声学因素,诸如口音来源(例如,母语、非母语)、语音通道(例如,移动、蓝牙、桌面等)、语音应用场景(例如,话音搜索、短消息口述等)和说话者变型(例如,单个说话者或集群说话者)等。本文中描述的技术在第一上下文中使用某些子模块并且在第二上下文中使用第二组子模块。 | ||
搜索关键词: | 模块化 深度 学习 模型 | ||
【主权项】:
1.一种自动语音识别(ASR)系统,包括:存储声学模型的计算机存储介质,所述声学模型被配置为标识声学信息内的声学单元;以及所述声学模型(AM)包括模块化深度学习模型,所述模块化深度学习模型包括多个隐藏层,所述多个隐藏层包括至少一个模块化层和共享层,所述至少一个模块化层包括多个特定于上下文的子模块,其中所述模块化层中的仅第一特定于上下文的子模块在第一上下文中处理所述声学信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780014729.6/,转载请声明来源钻瓜专利网。