[发明专利]模块化深度学习模型有效

申请号：	201780014729.6	申请日：	2017-02-27
公开（公告）号：	CN108701453B	公开（公告）日：	2023-04-04
发明（设计）人：	Y·黄;刘朝军;K·库玛;K·P·卡尔高卡;龚一凡	申请（专利权）人：	微软技术许可有限责任公司
主分类号：	G10L15/065	分类号：	G10L15/065;G06N3/045;G10L15/16
代理公司：	北京市金杜律师事务所 11256	代理人：	王茂华
地址：	美国华***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	本文中描述的技术使用模块化模型来处理语音。基于深度学习的声学模型包括不同类型的神经网络层的堆叠。基于深度学习的声学模型的子模块可以用于表示不同的非音素的声学因素，诸如口音来源(例如，母语、非母语)、语音通道(例如，移动、蓝牙、桌面等)、语音应用场景(例如，话音搜索、短消息口述等)和说话者变型(例如，单个说话者或集群说话者)等。本文中描述的技术在第一上下文中使用某些子模块并且在第二上下文中使用第二组子模块。
搜索关键词：	模块化深度学习模型
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种自动语音识别(ASR)系统，包括：存储声学模型的计算机存储介质，所述声学模型被配置为标识声学信息内的声学单元；以及所述声学模型(AM)包括模块化深度学习模型，所述模块化深度学习模型包括多个隐藏层，所述多个隐藏层包括至少一个模块化层和共享层，所述至少一个模块化层包括多个特定于上下文的子模块，其中所述模块化层中的仅第一特定于上下文的子模块在第一上下文中处理所述声学信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司，未经微软技术许可有限责任公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201780014729.6/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]模块化深度学习模型有效

专利文献下载