[发明专利]语音识别方法、装置、电子设备及存储介质在审
申请号: | 201811519005.X | 申请日: | 2018-12-12 |
公开(公告)号: | CN111326147A | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 邓耀;王飞 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G10L15/197 | 分类号: | G10L15/197;G10L15/02;G10L15/26;G10L15/06 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 邓超 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 存储 介质 | ||
本申请提供了一种语音识别方法、装置、电子设备及存储介质,包括:接收用户输入的语音信息;将语音信息转换成至少一个文本信息;将至少一个文本信息输入动态语言模型,获得动态语言模型输出的每个文本信息的第一命中概率;获得第一命中概率最高的文本信息。本申请实施例可以先将用户的语音信息转换成至少一个文本信息,然后将文本信息输入到动态语言模型中,由动态语言模型来获得每个文本信息的命中概率,然后选出命中概率最高的文本信息。由于动态语言模型是根据同一用户的历史数据信息作为样本训练获得的,因此,该动态语言模型输出的概率更贴近用户的使用习惯,从而有利于提高语音识别的准确率。
技术领域
本申请涉及语音识别技术领域,具体而言,涉及一种语音识别方法、装置、电子设备及存储介质。
背景技术
近年来,随着移动通信技术的快速发展,大量基于智能终端的应用程序(Application,APP)涌现了出来。叫车类APP是其中很受大众欢迎的一类。乘客可通过在APP输入出发地和目的地信息,发起用车请求,司机接收到订单之后根据乘客的出发地信息前去接驾。
用户在使用网约车时,可通过语音输入或文本输入的方式输入出发地信息和目的地信息,从而发起订单请求。对于通过语音输入的方式,通常是对用户输入的语音进行识别,并根据语音识别结果进行派单。现实生活中,相同的文字由不同的人表述可能会产生不同的语音,因此现有技术中对用户的语音识别往往存在识别准确率不高的问题。
发明内容
有鉴于此,本申请实施例的目的在于提供一种语音识别方法、装置、电子设备及存储介质,能够通过每个用户不同的动态语言模型来对用户的语音信息进行识别,从而改善现有技术中对用户的语音识别存在的识别准确率不高的问题。
一方面,本申请实施例提供一种语音识别方法,包括:接收用户输入的语音信息;将所述语音信息转换成至少一个文本信息;将所述至少一个文本信息输入动态语言模型,获得所述动态语言模型输出的所述至少一个文本信息中每个文本信息的第一命中概率,所述动态语言模型以所述用户的历史数据信息作为样本训练得到;获得第一命中概率最高的文本信息。
本申请实施例可以先将用户的语音信息转换成至少一个文本信息,然后将文本信息输入到动态语言模型中,由动态语言模型来获得至少一个文本信息中每个文本信息的命中概率,然后选出命中概率最高的文本信息。由于动态语言模型是根据同一用户的历史数据信息作为样本训练获得的,因此,该动态语言模型输出的概率更贴近用户的使用习惯,从而有利于提高语音识别的准确率。
可选地,在所述接收用户输入的语音信息之后,所述方法还包括:获取所述用户的第一时间段内的历史数据信息,所述历史数据信息包括多个历史目标地点以及多个历史目标地点中每个历史目标地点所占的权重值;将所述多个历史目标地点以及所述多个历史目标地点中每个历史目标地点所占的权重值作为样本,对所述动态语言模型进行训练,获得训练后的动态语言模型,其中,所述多个历史目标地点作为输入量,所述多个历史目标地点中每个历史目标地点所占的权重值作为输出量。
在本申请实施例中,可以用同一用户第一时间段内的历史数据信息训练动态语言模型,将多个历史目标地点作为自变量,将每个历史目标地点所占的权重值作为因变量,输入到动态语言模型中,对动态语言模型进行训练。由于采用的是相同用户的历史数据信息来训练动态语言模型,使得动态语言模型可以更加贴合用户的出行需求,并且使得动态语言模型相对于通用语音模型体积小,准确率高。
可选地,在将所述语音信息转换成具有相同发音的至少一个文本信息之后,所述方法还包括:将所述至少一个文本信息输入通用语言模型,获得所述通用语言模型输出的所述至少一个文本信息中每个文本信息的第二命中概率;获得所述第二命中概率最高的文本信息;将所述第一命中概率最高的文本信息与所述第二命中概率最高的文本信息进行比较,获得两者中的命中概率高的文本信息,并将该文本信息作为目标地点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811519005.X/2.html,转载请声明来源钻瓜专利网。