[发明专利]用于稳健语音识别的变量组件深度神经网络有效
申请号: | 201480075008.2 | 申请日: | 2014-09-09 |
公开(公告)号: | CN105960672B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | J·李;R·赵;Y·宫 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/20 |
代理公司: | 31100 上海专利商标事务所有限公司 | 代理人: | 胡利鸣<国际申请>=PCT/CN2014 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了用于结合环境变量的语音识别的系统和方法。该系统包括:语音捕捉设备(202);特征提取模块(204);环境变量模块(206),其中所述环境变量模块确定环境变量的值;以及语音识别解码器(208),其中所述语音识别译码器利用深度神经网络(DNN)来识别由所述语音捕捉装置捕捉的语音,其中所述DNN的一个或多个组件被建模为环境变量的一组函数。 | ||
搜索关键词: | 用于 稳健 语音 识别 变量 组件 深度 神经网络 | ||
【主权项】:
1.一种用于识别语音的方法,所述方法包括:/n捕捉语音输入;/n确定与其中所述语音被捕捉的环境相关的环境变量的值;/n接收所述语音输入和所述环境变量的值作为给变量组件深度神经网络VCDNN的一个或多个组件的输入,所述VCDNN的一个或多个组件具有一个或多个加权矩阵、一个或多个偏置、具有一个或多个输出的至少一个隐藏层,以及一个或多个节点的一个或多个激活函数,其中所述一个或多个加权矩阵、所述一个或多个偏置、所述隐藏层的一个或多个输出,以及所述一个或多个激活函数中的至少一者被建模为所述环境变量的函数;/n基于执行所述VCDNN来从所述VCDNN生成所述语音输入的输出向量;以及/n基于所述语音输入的输出向量产生经识别语音的输出。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201480075008.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种具备杀菌功能的除草剂配方及其制备方法
- 下一篇:自主远程控制设备