[发明专利]语音识别方法、装置和系统在审
申请号: | 201910376604.9 | 申请日: | 2019-05-07 |
公开(公告)号: | CN111916062A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 张仕良;刘媛;雷鸣;李威 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁;张文华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 系统 | ||
本申请公开了一种语音识别方法、装置和系统。其中,该方法包括:获取待识别语音,其中,待识别语音为包含至少一个语种的语音数据;基于识别模型对待识别语音进行识别,得到识别结果,其中,识别模型至少包括:混合声学模型、混合语言模型、混合词典,混合声学模型包括多个语种的声学模型,混合语言模型包括多个语种的语言模型,混合词典包括多个语种的词典。本申请解决了相关技术中仅能对特定语种的语音进行识别,无法对混合语音进行识别的技术问题。
技术领域
本申请涉及语音识别领域,具体而言,涉及一种语音识别方法、装置和系统。
背景技术
随着互联网的快速发展以及智能移动终端的普及应用,语音识别技术在人们的工作、生活和学习中得到了广泛的应用,例如,语音对话机器人、语音助手以及相关的互动工具等。这些设备通常通过对用户的语音进行识别,得到用户的识别指令,然后再执行与识别得到的指令对应的动作。
然而,不同的国家所采用的语言是不相同的,同一个国家的不同地区也会使用各种方言。现有技术需要根据每个语种利用收集到的数据针对性的去训练一套识别系统,通常包含专门的声学模型、语言模型、解码器以及发音词典,如图1所示的对特定语种的语音进行识别的示意图。其中,声学模型的输入为声学特征,声学特征在声学模型中通过神经网络得到声学建模单元的预测概率,即声学模型的输出为声学建模单元的预测概率,如图2所示;语言模型是通过文本数据训练得到的n-gram语言模型或者神经网络语言模型;解码器联合声学模型、语言模型以及发音词典得到最终的识别结果。该识别系统仅能针对特定语种的语音进行识别,例如,中文语音识别系统只能识别中文,英文识别系统只能识别英文。
在实际的应用场景中,例如,通过地铁购票机购买地铁票的用户可能不会说普通话,仅会说方言,或者其他语种的语言,如果地铁购票机仅能识别一种语言,则用户使用其他语言可能无法正常购票。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种语音识别方法、装置和系统,以至少解决相关技术中仅能对特定语种的语音进行识别,无法对混合语音进行识别的技术问题。
根据本申请实施例的一个方面,提供了一种语音识别方法,包括:获取待识别语音,其中,待识别语音为包含至少一个语种的语音数据;基于识别模型对待识别语音进行识别,得到识别结果,其中,识别模型至少包括:混合声学模型、混合语言模型、混合词典,混合声学模型包括多个语种的声学模型,混合语言模型包括多个语种的语言模型,混合词典包括多个语种的词典。
根据本申请实施例的另一方面,还提供了一种语音识别方法,包括:输入待识别语音,其中,待识别语音为包含至少一个语种的语音数据;输出与待识别语音的识别结果对应的反馈信息,其中,识别结果是由识别模型对待识别语音进行识别所得到的结果,识别模型至少包括:混合声学模型、混合语言模型、混合词典,混合声学模型包括多个语种的声学模型,混合语言模型包括多个语种的语言模型,混合词典包括多个语种的词典。
根据本申请实施例的另一方面,还提供了一种语音识别系统,包括:输入单元,用于获取待识别语音,其中,待识别语音为包含至少一个语种的语音数据;识别单元,用于基于识别模型对待识别语音进行识别,得到识别结果,其中,识别模型至少包括:混合声学模型、混合语言模型、混合词典,混合声学模型包括多个语种的声学模型,混合语言模型包括多个语种的语言模型,混合词典包括多个语种的词典;输出单元,用于输出与识别结果对应的反馈信息。
根据本申请实施例的另一方面,还提供了一种语音识别装置,包括:获取模块,用于获取待识别语音,其中,待识别语音为包含至少一个语种的语音数据;识别模块,用于基于识别模型对待识别语音进行识别,得到识别结果,其中,识别模型至少包括:混合声学模型、混合语言模型、混合词典,混合声学模型包括多个语种的声学模型,混合语言模型包括多个语种的语言模型,混合词典包括多个语种的词典。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910376604.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法及系统
- 下一篇:一种用于粘弹性溶液凝固检测的方法及装置