[发明专利]语音处理方法、装置、设备、存储介质及程序在审
申请号: | 202110913861.9 | 申请日: | 2021-08-10 |
公开(公告)号: | CN113643696A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 缪石乾 | 申请(专利权)人: | 阿波罗智联(北京)科技有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/22;G10L15/26;G10L15/30;G10L17/22 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 李哲;刘芳 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 装置 设备 存储 介质 程序 | ||
本公开提供了语音处理方法、装置、设备、存储介质及程序,涉及人工智能中的语音技术、自然语言处理技术领域。具体实现方案为:终端设备在接收第一语音信息的过程中,向服务器发送至少一个语音意图,每个语音意图为所述第一语音信息中的部分语音信息对应的语音意图;服务器获取所述至少一个语音意图对应的应答信息;终端设备在接收完成所述第一语音信息后,向所述服务器发送所述第一语音信息;服务器获取所述第一语音信息对应的第二语音意图,向终端设备发送第一语音意图对应的应答信息,所述第一语音意图为所述至少一个语音意图中与所述第二语音意图相同的语义意图;终端设备输出所述应答信息。通过上述过程中,降低了语音交互时延。
技术领域
本公开涉及人工智能中的语音技术、自然语言处理技术领域,尤其涉及一种语音处理方法、装置、设备、存储介质及程序。
背景技术
随着人工智能技术的发展,越来越多的终端设备支持语音交互功能。在语音交互过程,用户向终端设备输入语音信息,终端设备向用户输出与语音信息对应的应答信息。
相关技术中,语音交互场景中对语音信息的处理过程为:终端设备在接收到完整语音信息后,将完整的语音信息发送至服务器。服务器对完整的语音信息进行意图识别得到用户意图,根据用户意图获取对应的应答信息,并将应答信息发送给终端设备。进而,终端设备向用户输出应答信息。
然而,上述相关技术中,语音交互时延较高。
发明内容
本公开提供了一种语音处理方法、装置、设备、存储介质及程序。
根据本公开的第一方面,提供了一种语音处理方法,包括:
在接收第一语音信息的过程中,向服务器发送至少一个语音意图,每个语音意图为所述第一语音信息中的部分语音信息对应的语音意图;
响应于接收完成所述第一语音信息,向所述服务器发送所述第一语音信息;
从所述服务器接收第一语音意图对应的应答信息,所述应答信息为所述服务器在接收到所述第一语音意图后确定的,所述第一语音意图与所述第一语音信息对应的第二语音意图相同,所述至少一个语音意图包括所述第一语音意图;
输出所述应答信息。
根据本公开的第二方面,提供了一种语音处理方法,包括:
接收终端设备在接收第一语音信息的过程中发送的至少一个语音意图,并获取所述至少一个语音意图对应的应答信息,每个语音意图为所述第一语音信息中的部分语音信息对应的语音意图;
接收所述终端设备发送的所述第一语音信息,并获取所述第一语音信息对应的第二语音意图;
向所述终端设备发送第一语音意图对应的应答信息,所述第一语音意图为所述至少一个语音意图中与所述第二语音意图相同的语义意图。
根据本公开的第三方面,提供了一种语音处理装置,包括:发送模块、接收模块和输出模块;
所述发送模块,用于在接收第一语音信息的过程中,向服务器发送至少一个语音意图,每个语音意图为所述第一语音信息中的部分语音信息对应的语音意图;
所述发送模块,还用于响应于接收完成所述第一语音信息,向所述服务器发送所述第一语音信息;
所述接收模块,用于从所述服务器接收第一语音意图对应的应答信息,所述应答信息为所述服务器在接收到所述第一语音意图后确定的,所述第一语音意图与所述第一语音信息对应的第二语音意图相同,所述至少一个语音意图包括所述第一语音意图;
所述输出模块,用于输出所述应答信息。
根据本公开的第四方面,提供了一种语音处理装置,包括:接收模块、获取模块和发送模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿波罗智联(北京)科技有限公司,未经阿波罗智联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110913861.9/2.html,转载请声明来源钻瓜专利网。