[发明专利]语音识别方法、装置、电子设备及存储介质有效
申请号: | 201910912948.7 | 申请日: | 2019-09-25 |
公开(公告)号: | CN110534109B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 袁小薇;刘杰;刘云峰;吴悦;汶林丁 | 申请(专利权)人: | 深圳追一科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G06K9/62;G06K9/00 |
代理公司: | 深圳市智圈知识产权代理事务所(普通合伙) 44351 | 代理人: | 苗燕 |
地址: | 518057 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 存储 介质 | ||
本申请实施例公开了一种语音识别方法、装置、电子设备及存储介质。该方法包括:在语音采集过程中,检测到有效语音时,确定是否能够持续检测到有效语音;在无法持续检测到有效语音时,获取本次无法持续检测到有效语音的持续时间;判断持续时间是否超过预设检测时间;若持续时间超过预设检测时间,获取用户图像;判断用户图像中是否存在预设动作;若用户图像中不存在预设动作,则结束本次语音采集,并对本次采集的语音信号进行识别,以得到本次识别结果。本申请实施例通过在超时无有效语音时,通过判断是否存在预设动作,可准确结束采集,避免在用户结束本次语音输入时提前结束采集,改善用户的交互体验,并且有利于提高语音识别的准确性。
技术领域
本申请实施例涉及人机交互技术领域,更具体地,涉及一种语音识别方法、装置、电子设备及存储介质。
背景技术
语音采集是语音识别系统的基本功能和必要步骤之一,语音数据采集的处理时间在很大程度上决定语音识别系统的响应时间。在用户说完语音内容之后尽早结束语音数据采集,并进入到语音识别阶段,将会明显提升语音识别系统的响应速度。但是,目前语音识别对语音采集的效果不佳。
发明内容
鉴于上述问题,本申请实施例提供一种语音识别方法、装置、电子设备及存储介质,可以准确结束采集,改善交互体验。
第一方面,本申请实施例提供了一种语音识别方法,该语音识别方法可包括:在语音采集过程中,检测到有效语音时,确定是否能够持续检测到有效语音;在无法持续检测到有效语音时,获取本次无法持续检测到有效语音的持续时间;判断所述持续时间是否超过预设检测时间;若所述持续时间超过预设检测时间,获取用户图像;判断所述用户图像中是否存在预设动作;若所述用户图像中不存在预设动作,则结束本次语音采集,并对本次采集的语音信号进行识别,以得到本次识别结果。
可选地,所述判断本次持续时间是否超过预设检测时间之后,所述方法还包括:若所述持续时间未超过预设检测时间,则判断本次语音采集时间是否超过预设采集时间;若所述本次语音采集时间超过预设采集时间,对当前已采集的语音信号进行预先识别,以得到预先识别结果;判断所述预先识别结果是否正确;根据判断结果,获得本次识别结果。
可选地,所述判断所述预先识别结果是否正确,包括:对所述预先识别结果进行显示,以使所述用户确认所述预先识别结果是否正确;根据获取到的所述用户针对所述预先识别结果的确认指令,判断所述预先识别结果是否正确;或者基于所述预先识别结果,获取所述预先识别结果对应的预测识别结果;对所述预测识别结果进行显示,以使所述用户确认所述预测识别结果是否正确;根据获取到的所述用户针对所述预测识别结果的确认指令,判断所述预先识别结果是否正确。
可选地,所述基于所述预先识别结果,获取所述预先识别结果对应的预测识别结果,包括:基于所述预先识别结果,在预设指令库中查找是否存在与所述预先识别结果匹配的指令;若存在,则基于所述指令获取所述预先识别结果的目标关键词;确定所述目标关键词在所述预先识别结果中的目标位置;基于所述目标位置,获取所述目标关键词的上下文信息;对所述上下文信息进行识别,以得到所述预先识别结果对应的预测识别结果。
可选地,所述基于所述预先识别结果,获取所述预先识别结果对应的预测识别结果,包括:将所述预先识别结果输入预测神经网络模型,得到所述预先识别结果对应的预测识别结果,所述预测神经网络模型被预先训练,用于根据预先识别结果预测识别结果。
可选地,所述根据判断结果,获得本次识别结果,包括:若判断正确,则结束本次语音采集,将正确的识别结果作为本次识别结果;若判断错误,则继续本次语音采集,并返回执行在语音采集过程中,检测到有效语音时,确定是否能够持续检测到有效语音以及后续操作。
可选地,所述在语音采集过程中,检测有效语音之前,所述方法还包括:获取用户输入的触发指令,启动语音采集;基于所述触发指令,确定目标声源;将所述目标声源的语音信号作为本次语音采集的有效语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910912948.7/2.html,转载请声明来源钻瓜专利网。