[发明专利]语音识别方法、装置、电子设备和计算机可读存储介质在审
申请号: | 201911242719.5 | 申请日: | 2019-12-06 |
公开(公告)号: | CN110827808A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 谭志鹏;谭北平 | 申请(专利权)人: | 北京明略软件系统有限公司;清华大学 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L15/08;G10L15/14;G10L25/12;G10L25/30 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 孔默 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请提供一种语音识别方法、装置、电子设备和计算机可读存储介质,涉及语音识别技术领域。该语音识别方法应用于电子设备,电子设备维护有标准语音库和类比预测模型,该语音识别方法包括:根据用户输入的待识别语音信息获取第一特征信息;第一特征信息用于确定电子设备的反馈信息;判断第一特征信息与标准语音库是否匹配;若匹配,则执行与第一特征信息对应的第一目标操作;若不匹配,则根据第一特征信息和类比预测模型,执行第二目标操作。在每次用户语音输入信息后,将语音信息中的特征信息与标准语音库进行比对,比对不成功时,使用类比预测模型补充语音信息中的特征信息,并执行相应的操作,提高用户体验。
技术领域
本申请涉及语音识别技术领域,具体而言,涉及语音识别方法、装置、电子设备和计算机可读存储介质。
背景技术
语音交互技术作为当下高速发展的人工智能之一,已经深入到人类社会生活的方方面面。人机对话系统主要分为两类:目标驱动型人机对话系统和非目标驱动型人机对话系统。随着用户个性化需求的增加,语音交互必须向更加人性化、精确化的方向深入发展。
在目前的语音识别技术中,一次人机语音对话经常需要个体多次重复输入语音信息,语音系统也需要多次循环执行语音识别、数据搜索、语音反馈等各个程序,才能完成机器与用户之间的沟通。由于语音系统存在着误差,个体语音输入也存在着模糊性或不连续性,因此这种语音交互是不精确的,识别效率低下,远不能满足用户的需求。因此,如何根据用户的语音信息准确的执行操作是目前需要解决的问题。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的之一在于提供一种语音识别方法、装置、电子设备和计算机可读存储介质。
第一方面,实施例提供一种语音识别方法,应用于电子设备,所述电子设备维护有标准语音库和类比预测模型,所述类比预测模型用于根据语音特征确定所述电子设备的操作信息。所述方法包括:根据用户输入的待识别语音信息获取第一特征信息;所述第一特征信息用于确定所述电子设备的反馈信息;判断所述第一特征信息与所述标准语音库是否匹配;若匹配,则执行与所述第一特征信息对应的第一目标操作;若不匹配,则根据所述第一特征信息和所述类比预测模型,执行第二目标操作。
在可选的实施方式中,所述电子设备还维护有个性语音库,所述个性语音库包括多个特定特征信息。在所述根据所述第一特征信息和所述类比预测模型,执行第二目标操作之前,所述方法还包括:根据所述多个特定特征信息,获取所述类比预测模型。
在可选的实施方式中,所述方法还包括:将所述第一特征信息存储至所述个性语音库。
在可选的实施方式中,所述电子设备还维护有类比信息库,所述根据所述多个特定特征信息,获取所述类比预测模型,包括:获取所述多个特定特征信息的相关度信息;将多个训练特征信息存储至所述类比信息库;所述训练特征信息为所述多个特定特征信息中,所述相关度信息满足预设条件的特定特征信息;根据所述类比信息库,获取所述类比预测模型。
第二方面,实施例提供一种语音识别装置,包括:获取模块、判断模块和控制模块。所述语音识别装置维护有标准语音库和类比预测模型,所述类比预测模型用于根据语音特征确定所述语音识别装置的操作信息;所述获取模块用于根据用户输入的待识别语音信息获取第一特征信息;所述第一特征信息用于确定所述语音识别装置的反馈信息;所述判断模块用于判断所述第一特征信息与所述标准语音库是否匹配;所述控制模块用于当所述第一特征信息与所述标准语音库匹配时,执行与所述第一特征信息对应的第一目标操作;所述控制模块还用于当所述第一特征信息与所述标准语音库不匹配时,根据所述第一特征信息和所述类比预测模型,执行第二目标操作。
在可选的实施方式中,所述语音识别装置还维护有个性语音库,所述个性语音库包括多个特定特征信息;所述获取模块还用于根据所述多个特定特征信息,获取所述类比预测模型。
在可选的实施方式中,还包括存储模块。所述存储模块用于将所述第一特征信息存储至所述个性语音库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司;清华大学,未经北京明略软件系统有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911242719.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种镀锌丝生产用收卷装置
- 下一篇:褪黑素的制备方法