[发明专利]语音识别方法、装置、设备及存储介质有效
申请号: | 201811105895.X | 申请日: | 2018-09-21 |
公开(公告)号: | CN109243461B | 公开(公告)日: | 2020-04-14 |
发明(设计)人: | 韩文辉;蒋正翔 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/18;G10L15/06 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张芳;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 设备 存储 介质 | ||
本申请实施例提供一种语音识别方法、装置、设备及存储介质,通过获取终端设备上搭载的音频采集设备采集获得的语音信号,以及在采集获得该语音信号时终端设备所在的第一区域,采用预先存储的与第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型对语音信号进行语音识别处理,从而基于第一语音识别模型的第一识别结果和第二语音识别模型的第二识别结果,确定并输出目标输出的识别结果。本申请实施例提供的技术方案能够提高语音识别的准确性,提高用户体验。
技术领域
本申请实施例涉及语音识别技术领域,尤其涉及一种语音识别方法、装置、设备及存储介质。
背景技术
在目前的语音识别场景中通常采用一个通用的语言模型来对不同地域不同发音习惯用户的语音请求进行识别。以地图场景为例,在地图场景中通常使用一个训练自所有地名的语言模型对不同地域来源的语音请求进行解码识别。但是实际情况是,不同城市的地名/建筑名称/道路名称往往存在同音不同字的情况,同一个发音经常对应不同城市的街道(如海桐路(上海)和海铜路(重庆))、酒店(如爱俪轩(上海)和爱丽轩(廊坊))、建筑等,使得语音识别系统不确定哪个识别结果是用户目标输入的结果,只能呈现给用户在统计量上输出频率较高的识别结果,然而输出频率较高的识别结果不一定就是用户目标输入的结果,从而容易出现识别错误的情况,用户体验较差。
发明内容
本申请实施例提供一种语音识别方法、装置、设备及存储介质,用以提高语音识别的准确性,尤其是提高地图场景下语音识别的准确性。
本申请实施例第一方面提供一种语音识别方法,包括:获取终端设备上搭载的音频采集设备采集获得的语音信号,以及获取在采集获得所述语音信号时所述终端设备所在的第一区域;采用预先存储的与所述第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型,对所述语音信号进行语音识别处理,其中所述第一语音识别模型是基于所述第一区域中的语音样本训练获得的;基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果,确定目标输出的识别结果。
本申请实施例第二方面提供一种语音识别装置,包括:获取模块,用于获取终端设备上搭载的音频采集设备采集获得的语音信号,以及获取在采集获得所述语音信号时所述终端设备所在的第一区域;识别模块,用于采用预先存储的与所述第一区域对应的第一语音识别模型以及预先设定的所有区域通用的第二语音识别模型,对所述语音信号进行语音识别处理,其中所述第一语音识别模型是基于所述第一区域中的语音样本训练获得的;第一确定模块,用于基于所述第一语音识别模型的第一识别结果和所述第二语音识别模型的第二识别结果,确定目标输出的识别结果。
本申请实施例第三方面提供一种计算机设备,包括:一个或多个处理器;一个或多个音频采集设备,所述音频采集设备与所述处理器连接,用于采集语音信号;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述第一方面所述的方法。
本申请实施例第四方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811105895.X/2.html,转载请声明来源钻瓜专利网。