[发明专利]语音识别系统及方法有效
申请号: | 201911291781.3 | 申请日: | 2019-12-16 |
公开(公告)号: | CN110970031B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 俞凯;马娆;李豪;刘奇;陈露 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/16;G10L15/06 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 方法 | ||
1.一种语音识别系统,包括:
词格生成模块,配置为根据待识别语句确定相应的待识别词格;
双向LSTM编码器,配置为按照所述待识别词格的正向拓扑顺序确定每一个词语的前向隐藏状态,按照所述待识别词格的逆向拓扑顺序确定每一个词语的后向隐藏状态,并基于每一个词语的成对的前向隐藏状态和后向隐藏状态确定对应于每个词语的上下文表示信息;
单向LSTM解码器,配置为基于所述双向LSTM编码器的最后时刻的隐藏状态进行初始化,其中,所述每一个词语的成对的前向隐藏状态和后向隐藏状态对应于所述每个词语的上下文表示信息,并根据初始化之后的单向LSTM解码器的隐藏状态和所述双向LSTM编码器的隐藏状态确定概率分布。
2.根据权利要求1所述的系统,其中,所述待识别词格包括多个节点,节点之间的连线上配置有前向概率和后向概率,每个节点上配置有边缘概率。
3.根据权利要求2所述的系统,其中,所述前向隐藏状态包括隐藏向量和单元向量;
所述按照所述待识别词格的正向拓扑顺序确定每一个词语的前向隐藏状态包括:
按所述待识别词格的正向拓扑顺序扫描词语标签,并为每个词语生成隐藏状态;
在时间步骤i,确定wi的之前的词语并表示为集合Pi;
先前时间步的隐藏向量和单元向量被汇总为:
其中,wi指的是输入的句子中第i个单词;
hk指的是词格中第k个节点对应的隐藏层向量;
ck指的是词格中第k个节点对应的上下文向量;
Pi指的是词格中第i个节点对应的所有前驱节点集合;
k指的是代指Pi中的任何一个元素;
指的是1除以Pi的集合大小。
4.根据权利要求3所述的系统,其中,还包括:基于所述后向概率对所述隐藏向量和所述单元向量更新如下:
其中,Sh,Sc是所述单向LSTM解码器的softmax层的参数向量。
5.根据权利要求4所述的系统,其中,所述基于所述双向LSTM编码器的最后时刻的隐藏状态进行初始化包括:
所述单向LSTM解码器的隐藏状态初始化为:
s0=hN,n0=cN
hN和cN是所述双向LSTM编码器的最终时刻的所述隐藏向量和所述单元向量;
在时间步骤j,给定所述单向LSTM解码器的隐藏状态sj-1,nj-1和第j个目标词语的嵌入yj,所述单向LSTM解码器的隐藏状态被更新为:
sj,nj=LSTM(yj,sj-1,nj-1)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911291781.3/1.html,转载请声明来源钻瓜专利网。