首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]用于大词汇量连续语音识别的深度信任网络有效

申请号：	201110289015.0	申请日：	2011-09-14
公开（公告）号：	CN102411931A	公开（公告）日：	2012-04-11
发明（设计）人：	L·邓;D·俞;G·E·达尔	申请（专利权）人：	微软公司
主分类号：	G10L15/14	分类号：	G10L15/14;G10L15/16
代理公司：	上海专利商标事务所有限公司 31100	代理人：	胡利鸣
地址：	美国华***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于词汇量连续语音识别深度信任网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种方法，包括以下计算机可执行动作：

致使处理器接收采样，其中该采样是讲出的发言、在线手写采样、或者描述物体的运动的视频信号之一；以及

致使处理器至少部分基于深度结构与隐马尔科夫模型(HMM)的依赖于上下文的组合的输出对该采样进行解码，其中该深度结构被配置为输出依赖于上下文的单元的后验概率。

2.如权利要求1所述的方法，其特征在于，该采样是讲出的发言，并且其中该依赖于上下文的单元是senone。

3.如权利要求1所述的方法，其特征在于，该深度结构是深度信任网络(DBN)。

4.如权利要求3所述的方法，其特征在于，该DNB是概率生成性模型，该概率生成性模型包括处于表示数据矢量的所观察到的变量的单个底层之上的多层随机隐藏单元。

5.如权利要求4所述的方法，其特征在于，该DBN是前馈人工神经网络(ANN)。

6.如权利要求1所述的方法，其特征在于，进一步包括：在该深度结构与该HMM的组合的训练阶段期间，从高斯混合模型(GMM)-HMM系统中导出该深度结构与该HMM的组合。

7.如权利要求1所述的方法，其特征在于，进一步包括：在该深度结构与该HMM的组合的训练阶段期间，对该深度结构执行预训练。

8.如权利要求7所述的方法，其特征在于，该深度结构包括多个隐藏随机层，并且其中预训练包括使用不受监督的算法来初始化所述隐藏随机层之间的连接的权重。

9.如权利要求8所述的方法，其特征在于，进一步包括：使用反向传播来进一步细化所述隐藏随机层之间的连接的权重。

10.一种计算机实现的语音识别系统，包括：

处理器(802)；以及

能够由该处理器来执行的多个组件，所述多个组件包括：

深度结构与HMM的计算机可执行的组合(106)，该组合(106)接收输入采样，其中该输入采样是讲出的发言或者在线手写采样之一，其中深度结构与HMM的组合输出与该输入采样有关的依赖于上下文的单元的随机分布；以及

解码器组件(108)，该解码器组件(108)至少部分基于与该输入采样有关的依赖于上下文的单元的随机分布对来自该输入采样的词语序列进行解码。

11.如权利要求10所述的系统，其特征在于，该输入采样是讲出的解码器，并且其中该依赖于上下文的单元是senone。

12.如权利要求10所述的系统，其特征在于，该深度结构是深度信任网络(DBN)。

13.如权利要求12所述的系统，其特征在于，该DNB是概率生成性模型，该概率生成性模型包括处于表示数据矢量的所观察到的变量的单个底层之上的多层随机隐藏单元。

14.如权利要求13所述的系统，其特征在于，该组件进一步包括转换器/训练器组件，该转换器/训练器组件至少部分基于高斯混合模型(GMM)-HMM系统生成深度结构与HMM的组合。

15.如权利要求12所述的系统，其特征在于，该HMM被配置为输出与该输入采样相对应的依赖于上下文的单元之间的转移概率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于微软公司，未经微软公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201110289015.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种方便拆卸的传感器密封装置
下一篇：一种液体回收系统

同类专利

专利分类

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top