[发明专利]一种语音识别系统有效
申请号: | 201611101551.2 | 申请日: | 2016-12-05 |
公开(公告)号: | CN106653007B | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 沈小正;张光宇;朱孟旭;代大明;肖佳林 | 申请(专利权)人: | 苏州奇梦者网络科技有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/26;G10L15/28;G10L15/18 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 李广 |
地址: | 215000 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种语音识别系统,由基本的基于声学模型到拼音映射网络的基础识别器和任意多个针对不同应用领域的基于拼音到词语映射网络的特定识别器以及一个综合决策单元共同组成。语音首先通过基础识别器映射为由多个候选拼音序列组织成的网络,然后该拼音网络再通过和一个对应特定应用目标的特定识别器进行组合,最后在组合后的网络上进行最佳路径的搜索,得到最终的识别结果。在这种架构下,拼音网络可以和多个应用领域的单独的拼音到词语映射的特定识别器进行组合,最终根据声学和语言模型评分以及其他应用相关的超级规则选择最佳的识别结果。 | ||
搜索关键词: | 一种 语音 识别 系统 | ||
【主权项】:
1.一种语音识别系统,其特征在于:包括‑基于声学模型到拼音映射网络的基础识别器,用于将语音映射为由多个候选拼音序列组织成的网络;‑多个并列的针对不同应用领域的基于拼音到词语映射网络的特定识别器,用于分别与由多个候选拼音序列组织成的网络进行组合,得到多个最佳词序列及置信度;‑综合决策单元,用于接收多个最佳词序列及置信度,然后根据置信度再加上预先给定的先验知识和预设规则以及附加信息,进行决策,选择最佳的词序列输出;通过调整拼音到词语映射网络,添加新的识别内容到已有领域的基于拼音到词语映射网络的特定识别器中,更新已有领域的识别内容;通过离线构造对应的基于拼音到词语映射网络的特定识别器,然后将扩展内容在线添加到基于拼音到词语映射网络的特定识别器中,创建新的应用领域的识别内容;所述基于声学模型到拼音映射网络的基础识别器根据输入的音频特征动态计算声学得分,并在其网络上保存有拼音序列的语言模型得分,采用动态规划算法结合声学得分和语言模型得分,搜索得分最高的若干拼音序列输出;所述拼音序列的语言模型采用基于长短时记忆单元的递归神经网络进行建模;所述综合决策单元通过融合识别置信度、先验知识和预设规则以及附加信息来选择最佳候选词序列;所述先验知识至少包括所述语音识别系统之外输入的关于领域的标识信息,或者根据识别结果历史信息得到的领域标识信息;所述领域标识信息为离散的0/1置,或连续的概率值;所述预设规则至少包括根据音频长度预估的词数范围;所述附加信息包括根据超级语言模型得到的关于识别结果词串符合语法规范的程度度量;所述综合决策单元将所述附加信息和预设规则通过分层加权的方式和置信度评分一起作为决策准则来选择候选词序列作为最终识别结果输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州奇梦者网络科技有限公司,未经苏州奇梦者网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611101551.2/,转载请声明来源钻瓜专利网。
- 上一篇:刀柄(160311)
- 下一篇:手柄