[发明专利]语音识别方法、装置、存储介质及电子设备在审
申请号: | 202110011888.9 | 申请日: | 2021-01-06 |
公开(公告)号: | CN112820294A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 陈进;梁微;林锋;庄莉 | 申请(专利权)人: | 镁佳(北京)科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 北京臻之知识产权代理有限公司 11629 | 代理人: | 赵福梅 |
地址: | 100000 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 存储 介质 电子设备 | ||
本公开涉及一种语音识别方法、装置、存储介质及电子设备,该方法通过将接收到的用户语音信息识别为语音文本,该语音文本包括位置标识信息;从该语音文本中识别该位置标识信息;获取该位置标识信息对应的至少一个音素序列;在根据至少一个音素序列确定该位置识别信息易被混淆的情况下,根据至少一个该音素序列确定校正之后的目标位置信息;根据该目标位置信息生成该用户语音信息对应的目标语音文本。这样,能够根据位置标识信息对应的音素序列得到准确性较高的目标位置信息,能够有效避免各种发音不准造成的地点识别错误的情况发生,能够有效提升语音识别结果的准确性,从而能够提升语音识别系统用户的体验。
技术领域
本公开涉及语音对话领域,具体地,涉及一种语音识别方法、装置、存储介质及电子设备。
背景技术
语音识别是一种将数字语音转换为计算机可以理解的文字的技术。最近几年,语音识别技术取得显著进展,语音识别技术逐渐走入人们的生活,给我们的生活、工作带来便利。
目前的语音识别,经常因为用户的发音不准或者存在同音字词的情况而造成语音识别结果不准确的问题,尤其在电子地图,导航等应用场景中,若对地点信息识别错误,则很容易导致南辕北辙的现象出现,从而不仅无法为用户提供便利,反而会给用户带来不必要的麻烦,如此会非常不利于提升用户体验。
发明内容
本公开的目的是提供一种语音识别方法、装置、存储介质及电子设备。
为了实现上述目的,本公开的第一方面提供一种语音识别方法,所述方法包括:
将接收到的用户语音信息识别为语音文本,所述语音文本包括位置标识信息;
从所述语音文本中识别所述位置标识信息;
获取所述位置标识信息对应的至少一个音素序列;
在根据所述至少一个音素序列确定所述位置识别信息易被混淆的情况下,根据至少一个所述音素序列确定校正之后的目标位置信息;
根据所述目标位置信息生成所述用户语音信息对应的目标语音文本。
可选地,所述根据所述至少一个音素序列确定所述位置识别信息易被混淆的情况,包括:
在确定目标数据库中存在至少一个所述音素序列中的至少一个的情况下,从所述目标数据库中获取所述至少一个所述音素序列对应的至少一个候选音素序列,所述候选音素序列为在所述目标数据库内所述音素序列对应的易错音素序列,中间音素序列或者标准音素序列;
获取每个所述候选音素序列的映射关系,所述映射关系包括映射节点属性和映射方向属性,所述映射节点属性包括映射根节点和映射尾节点,所述映射方向属性包括单向映射和双向映射;
若确定该候选音素序列对应的映射方向属性包括双向映射,则确定所述位置识别信息易被混淆;
若确定该候选音素序列对应的映射方向属性仅包括单向映射,且在该单向映射的映射关系中该候选音素序列为映射根节点,则确定所述位置识别信息易被混淆。
可选地,所述目标数据库,通过以下方式预先生成:
获取多个区域中每个区域对应的易错音素序列组,所述易错音素序列组包括该区域内的多个位置信息对应的易错音素序列;
获取每个所述易错音素序列对应的所述中间音素序列和标准音素序列,以得到该区域对应的音素序列集合;
建立每个所述易错音素序列与所述中间音素序列,以及所述中间音素序列与标准音素序列之间的所述映射关系,以生成多个区域对应的所述目标数据库。
可选地,所述确定目标数据库中存在至少一个所述音素序列中的至少一个,包括:
获取目标终端当前所处的目标区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于镁佳(北京)科技有限公司,未经镁佳(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110011888.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:深基坑结构和深基坑施工工艺
- 下一篇:一种数据传输方法及电子设备