[发明专利]语音识别方法和语音识别系统有效
申请号: | 201310271192.5 | 申请日: | 2013-07-01 |
公开(公告)号: | CN103325370A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | 贾磊;万广鲁 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/14 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 王兆赓;李柱天 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 系统 | ||
1.一种语音识别方法,包括:
接收语音输入并提取语音帧特征;
通过使用解码空间对输入的语音进行语音解码,以确定语音解码结果,其中,解码空间包括基于语法规则构造的多条解码路径,所述多条解码路径包括仅包含类语言模型节点的解码路径、仅包含统计语言模型节点的解码路径以及包含类语言模型节点和统计语言模型节点二者的解码路径的三种类型的解码路径;
通过回溯选择的解码路径上的各个节点确定语义解析结果,
其中,所述语音解码的步骤包括:将输入的语音遍历解码空间中的每一条解码路径,选择语言层得分与声学层得分之和最大的一条解码路径,并根据选择的解码路径上的各个节点的三音子声学模型确定语音解码结果。
2.根据权利要求1所述的语音识别方法,其中,每条解码路径的语言层得分为该解码路径上的各个节点之间的类语言模型概率P-Class与该解码路径上的统计语言模型节点的统计语言模型概率P-Ngram之和,每条解码路径的声学层得分为该解码路径上的各个节点的三音子声学模型得分之和。
3.根据权利要求2所述的语音识别方法,其中,通过训练获得类语言模型概率P-Class和统计语言模型概率P-Ngram。
4.根据权利要求1所述的语音识别方法,其中,对于统计语言模型节点,与该节点相应的统计语言模型的词典中的每个词的尾部被连接到到词典中的任何一个词的头部,从而实现整个词典的自跳转,并且每个词被展开为对应的三音子声学模型。
5.根据权利要求1所述的语音识别方法,其中,对于类语言模型节点,与该节点相应的词类词被展开为对应的三音子声学模型。
6.根据权利要求4或5所述的语音识别方法,其中,在解码空间中,三音子声学模型在保证输出词和路径概率得分一致的基础上被合并。
7.根据权利要求6所述的语音识别方法,其中,通过WFST算法对三音子声学模型进行合并。
8.根据权利要求4所述的语音识别方法,其中,所述语音解码的步骤包括:如果遇到统计语言模型节点,则根据历史词和当前词得到完整的语音查询序列,并使用该完整的语音查询序列进行统计语言模型的查询,以确定该节点的三音子声学模型。
9.根据权利要求5所述的语音识别方法,其中,所述语音解码的步骤包括:如果遇到类语言模型节点,则直接使用与该节点相应的词类词的三音子声学模型。
10.根据权利要求1所述的语音识别方法,还包括:通过将语音解码结果和语义解析结果结合来输出最终的语音识别结果。
11.一种语音识别系统,包括:
输入单元,接收语音输入并提取语音帧特征;
存储器,存储解码空间,解码空间包括基于语法规则构造的多条解码路径,所述多条解码路径包括仅包含类语言模型节点的解码路径、仅包含统计语言模型节点的解码路径以及包含类语言模型节点和统计语言模型节点二者的解码路径的三种类型的解码路径;
控制器,包括语音解码单元和语义解析单元,其中,语音解码单元将输入的语音遍历解码空间中的每一条解码路径,选择语言层得分与声学层得分之和最大的一条解码路径,并根据选择的解码路径上的各个节点的三音子声学模型确定语音解码结果,语义解析单元通过回溯选择的解码路径上的各个节点确定语义解析结果。
12.根据权利要求11所述的语音识别系统,其中,每条解码路径的语言层得分为该解码路径上的各个节点之间的类语言模型概率P-Class与该解码路径上的统计语言模型节点的统计语言模型概率P-Ngram之和,每条解码路径的声学层得分为该解码路径上的各个节点的三音子声学模型得分之和。
13.根据权利要求12所述的语音识别系统,其中,通过训练获得类语言模型概率P-Class和统计语言模型概率P-Ngram。
14.根据权利要求11所述的语音识别系统,其中,对于统计语言模型节点,与该节点相应的统计语言模型的词典中的每个词的尾部被连接到到词典中的任何一个词的头部,从而实现整个词典的自跳转,并且每个词被展开为对应的三音子声学模型。
15.根据权利要求12所述的语音识别系统,其中,对于类语言模型节点,与该节点相应的词类词被展开为对应的三音子声学模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310271192.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种注射器辅助套
- 下一篇:一种多功能便携式治疗盘