[发明专利]音频处理方法、装置及存储介质在审
申请号: | 201910760806.3 | 申请日: | 2019-08-16 |
公开(公告)号: | CN110619873A | 公开(公告)日: | 2019-12-27 |
发明(设计)人: | 路康虹;杨瑞;冯小川;崔世起;韩伟;秦斌;王刚;李丹 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/48 |
代理公司: | 11270 北京派特恩知识产权代理有限公司 | 代理人: | 王黎延;马广禄 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频数据 目标音频数据 目标应用程序 音频响应 音频信号 响应 唤醒 存储介质 对话流程 音频处理 正确率 孤立 检测 概率 | ||
本公开是关于一种音频处理方法、装置及存储介质,该方法包括:在唤醒目标应用程序之后,获取第一音频信号所对应的第一音频数据;在获取第一音频数据的过程中,如果检测到第二音频信号所对应的第二音频数据,则获取第二音频数据;根据第一音频数据和第二音频数据,得到目标音频数据。本公开的技术方案,相较于对接收到的音频数据进行响应之后再对下一个音频数据进行处理,无需再次唤醒目标应用程序,能简化对话流程;且结合第一音频数据和第二音频数据,得到目标音频数据,对目标音频数据一起进行音频响应,能够更精确的获得用户真实需求,减少孤立的分别响应第一音频数据和第二音频数据所导致的响应错误的概率,提升了音频响应的正确率。
技术领域
本公开涉及信息技术领域,尤其涉及一种音频处理方法、装置及存储介质。
背景技术
目前,通过语音进行人机交互的交互方式受到了广泛关注,整个互联网行业都在积极探索语音交互可能的应用方式和应用场景,且已经有大量基于语音交互的产品面世,如智能音箱、语音助手等。其中,语音助手几乎成为了各个厂家的新品发布会的重点,在一定程度上影响了用户的消费选择。但是,用户与语音助手进行交互的过程中,存在对话过程繁杂,且对话不流畅的问题。
发明内容
本公开提供一种音频处理方法、装置及存储介质。
根据本公开实施例的第一方面,提供一种音频处理方法,所述方法应用于电子设备,包括:
在唤醒目标应用程序之后,获取第一音频信号所对应的第一音频数据;
在获取所述第一音频数据的过程中,如果检测到第二音频信号所对应的第二音频数据,则获取所述第二音频数据;
根据所述第一音频数据和所述第二音频数据,得到目标音频数据。
可选的,所述方法还包括:
确定结束获取所述第一音频数据与开始获取所述第二音频数据之间的时间差;
所述根据所述第一音频数据和所述第二音频数据,得到目标音频数据,包括:
如果所述时间差大于或者等于第一设定时长,则根据所述第一音频数据和所述第二音频数据,得到所述目标音频数据。
可选的,所述如果所述时间差大于或者等于第一设定时长,则根据所述第一音频数据和所述第二音频数据,得到所述目标音频数据,包括:
如果所述时间差大于或者等于第一设定时长,则检测所述第一音频数据的输入是否完整;
如果所述第一音频数据的输入不完整,则根据所述第一音频数据和所述第二音频数据,得到所述目标音频数据。
可选的,所述如果所述第一音频数据的输入不完整,则根据所述第一音频数据和所述第二音频数据,得到所述目标音频数据,包括:
如果第一音频数据的输入不完整,判断所述第一音频数据与所述第二音频数据是否能够拼接;
如果所述第一音频数据与所述第二音频数据能够拼接,则将所述第一音频数据与所述第二音频数据进行拼接,得到目标音频数据。
可选的,所述方法还包括:
如果所述第一音频数据的输入完整,则将所述第一音频数据和所述第二音频数据分别确定为所述目标音频数据。
可选的,所述方法还包括:
对所述目标音频数据进行回声消除处理;
基于进行回声消除处理后的目标音频数据,得到响应信息;
输出所述响应信息。
可选的,所述方法还包括:
获取待检测音频数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910760806.3/2.html,转载请声明来源钻瓜专利网。