[发明专利]一种语音处理方法、装置及存储介质在审
申请号: | 202010819665.0 | 申请日: | 2020-08-14 |
公开(公告)号: | CN111968680A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 姬光飞 | 申请(专利权)人: | 北京小米松果电子有限公司 |
主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L15/30;G10L15/34;G10L15/04 |
代理公司: | 北京善任知识产权代理有限公司 11650 | 代理人: | 康艳青 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 存储 介质 | ||
本公开是关于一种语音处理方法、装置及存储介质。该方法应用于电子设备,所述方法包括:采集音频数据,获取云服务器基于所述音频数据得到的第一语音识别结果;根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测。本公开实施例中,在采集到音频数据之后,能够获取云服务器基于音频数据得到的第一语音识别结果,并根据第一语音识别结果确定是否进行音频数据的语音端点检测。通过云服务器的语音识别技术辅助电子设备对音频数据的语音端点进行检测,能够使得检测精确度更高,减少由于环境噪声引起的误判停,进而提高语音交互的成功率,进而提高用户体验感。
技术领域
本公开涉及语音信息技术领域,尤其涉及一种语音处理方法、装置及存储介质。
背景技术
目前,通过语音进行人机交互的交互方式受到了广泛关注,整个互联网行业都在积极探索语音交互可能的应用方式和应用场景,且已经有大量基于语音交互的电子设备面世,如智能音箱等。
相关技术中,电子设备在采集到音频数据之后,会直接对采集到的音频数据进行端点检测,以对采集到的音频数据进行判停,同时将音频数据发送至云服务器进行语音识别。但是,由于环境噪声的存在,电子设备容易发生误判停,会导致音频数据不能发送至云服务器或者只有部分发送至云服务器,进而导致语音交互失败。
发明内容
本公开提供一种语音处理方法、装置及存储介质。
根据本公开实施例的第一方面,提供一种语音处理方法,应用于电子设备,所述方法包括:
采集音频数据,获取云服务器基于所述音频数据得到的第一语音识别结果;
根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测。
可选的,所述获取基于所述音频数据得到的第一语音识别结果,包括:
发送所述音频数据至云服务器;
接收所述云服务器反馈的基于自动语音识别技术ASR对所述音频数据进行处理得到的所述第一语音识别结果。
可选的,在所述获取基于所述音频数据得到的第一语音识别结果之前,所述方法还包括:
检测所述音频数据中是否包含唤醒信息;
如果所述音频数据中包含所述唤醒信息,则确定所述电子设备处于唤醒状态。
可选的,所述第一语音识别结果包含与所述音频数据对应的内容长度;
所述根据所述第一语音识别结果,确定是否进行所述音频数据的语音端点检测,包括:
在第一预设时间内,当所述内容长度大于预设长度阈值时,确定开始进行所述音频数据的语音端点检测。
可选的,所述方法还包括:
如果在所述第一预设时间内未获取到所述第一语音识别结果,则确定不进行所述音频数据的语音端点检测。
可选的,所述方法还包括:
当确定进行所述音频数据的所述语音端点检测后,获取云服务器基于所述音频数据得到的第二语音识别结果;
确定获取到第一第一语音识别结果的第一时刻与获取到第二第一语音识别结果的第二时刻之间的时间间隔;
当所述时间间隔大于或等于第二预设时间时,确定结束所述音频数据的语音端点检测。
可选的,所述方法还包括:
接收云服务器根据所述第一语音识别结果反馈的唤醒响应信息;
输出所述唤醒响应信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米松果电子有限公司,未经北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010819665.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种棒料剪切机
- 下一篇:一种具疏通功能的气力垃圾管道收集系统