[发明专利]全双工语音对话方法及系统有效

申请号：	201910831253.6	申请日：	2019-09-04
公开（公告）号：	CN112447177B	公开（公告）日：	2022-08-23
发明（设计）人：	邓建凯;甘津瑞	申请（专利权）人：	思必驰科技股份有限公司
主分类号：	G10L15/30	分类号：	G10L15/30;G10L25/87
代理公司：	北京商专永信知识产权代理事务所(普通合伙) 11400	代理人：	黄谦;车江华
地址：	215123 江苏省苏州市苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	双工语音对话方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开一种全双工语音对话方法，包括：当语音对话终端被唤醒之后，开始录制并上传音频至云端服务器，用于云端服务器确定答复内容以及为确定答复内容所分析的音频的第一时长；语音对话终端接收云端服务器发送的答复内容和所述第一时长；语音对话终端判断第一时长与第二时长是否一致，第二时长为语音对话终端所上传音频的总时长；当第一时长与第二时长一致时，将语音对话终端将答复内容呈现给用户。本申请实施例中语音对话终端不仅仅获取了云端服务器所确定的答复内容，而且还获取了云端服务器为确定该答复内容所分析的音频的时长，并且在确定第一时长和第二时长一致的情况下才将答复内容呈现给用户，确保了提供正确的答复内容。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种全双工语音对话方法及系统。

背景技术

现有语音对话中的全双工交互模式，即在唤醒状态下随时都可以进行语音交互的一种模式。与半双工的最大区别是对话的自由性更多由用户来控制，用户可以随时打断对话状态并开启下一轮交互。

然而，发明人在实现本申请的过程中发现，现有技术中的全双工语音对话方法至少存在以下技术问题：

无法定位情景：无法对应到用户正处的情景中，用户已经开启了第二个话题，但系统还在第一个话题的逻辑中跟用户交互。原因可能是由于网络不稳定等因素，在交互过程中有时候系统还没给用户反馈，而这个时候用户已经开始下一个话题的交互了，从而导致系统跟用户的交互不在同一个话题中。

无法区别对待：有些用户说话语速比较快，有些用户语速比较慢，在全双工模式下经常对用户所说的话理解一半就开始交互从而导致交互体验下降。原因可能在于全双工一开始的定位就是即在唤醒状态下随时都可以进行语音交互的一种模式，从而导致只要有语义命中就开始交互。

发明内容

本申请实施例提供一种全双工语音对话方法及系统，用于至少解决上述技术问题之一。

第一方面，本申请实施例提供一种全双工语音对话方法，用于语音对话终端，所述方法包括：

当所述语音对话终端被唤醒之后，开始录制并上传音频至云端服务器，用于所述云端服务器确定答复内容以及为确定所述答复内容所分析的音频的第一时长；

所述语音对话终端接收所述云端服务器发送的所述答复内容和所述第一时长；