[发明专利]语音处理方法、装置、设备、存储介质及程序在审

申请号：	202110913861.9	申请日：	2021-08-10
公开（公告）号：	CN113643696A	公开（公告）日：	2021-11-12
发明（设计）人：	缪石乾	申请（专利权）人：	阿波罗智联（北京）科技有限公司
主分类号：	G10L15/18	分类号：	G10L15/18;G10L15/22;G10L15/26;G10L15/30;G10L17/22
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	李哲;刘芳
地址：	100176 北京市北京经济***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音处理方法装置设备存储介质程序
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了语音处理方法、装置、设备、存储介质及程序，涉及人工智能中的语音技术、自然语言处理技术领域。具体实现方案为：终端设备在接收第一语音信息的过程中，向服务器发送至少一个语音意图，每个语音意图为所述第一语音信息中的部分语音信息对应的语音意图；服务器获取所述至少一个语音意图对应的应答信息；终端设备在接收完成所述第一语音信息后，向所述服务器发送所述第一语音信息；服务器获取所述第一语音信息对应的第二语音意图，向终端设备发送第一语音意图对应的应答信息，所述第一语音意图为所述至少一个语音意图中与所述第二语音意图相同的语义意图；终端设备输出所述应答信息。通过上述过程中，降低了语音交互时延。

技术领域

本公开涉及人工智能中的语音技术、自然语言处理技术领域，尤其涉及一种语音处理方法、装置、设备、存储介质及程序。

背景技术

随着人工智能技术的发展，越来越多的终端设备支持语音交互功能。在语音交互过程，用户向终端设备输入语音信息，终端设备向用户输出与语音信息对应的应答信息。

相关技术中，语音交互场景中对语音信息的处理过程为：终端设备在接收到完整语音信息后，将完整的语音信息发送至服务器。服务器对完整的语音信息进行意图识别得到用户意图，根据用户意图获取对应的应答信息，并将应答信息发送给终端设备。进而，终端设备向用户输出应答信息。

然而，上述相关技术中，语音交互时延较高。

发明内容

本公开提供了一种语音处理方法、装置、设备、存储介质及程序。

根据本公开的第一方面，提供了一种语音处理方法，包括：

在接收第一语音信息的过程中，向服务器发送至少一个语音意图，每个语音意图为所述第一语音信息中的部分语音信息对应的语音意图；

响应于接收完成所述第一语音信息，向所述服务器发送所述第一语音信息；

从所述服务器接收第一语音意图对应的应答信息，所述应答信息为所述服务器在接收到所述第一语音意图后确定的，所述第一语音意图与所述第一语音信息对应的第二语音意图相同，所述至少一个语音意图包括所述第一语音意图；