[发明专利]全双工语音对话方法及系统有效
申请号: | 201910831253.6 | 申请日: | 2019-09-04 |
公开(公告)号: | CN112447177B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 邓建凯;甘津瑞 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/30 | 分类号: | G10L15/30;G10L25/87 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 双工 语音 对话 方法 系统 | ||
本申请公开一种全双工语音对话方法,包括:当语音对话终端被唤醒之后,开始录制并上传音频至云端服务器,用于云端服务器确定答复内容以及为确定答复内容所分析的音频的第一时长;语音对话终端接收云端服务器发送的答复内容和所述第一时长;语音对话终端判断第一时长与第二时长是否一致,第二时长为语音对话终端所上传音频的总时长;当第一时长与第二时长一致时,将语音对话终端将答复内容呈现给用户。本申请实施例中语音对话终端不仅仅获取了云端服务器所确定的答复内容,而且还获取了云端服务器为确定该答复内容所分析的音频的时长,并且在确定第一时长和第二时长一致的情况下才将答复内容呈现给用户,确保了提供正确的答复内容。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种全双工语音对话方法及系统。
背景技术
现有语音对话中的全双工交互模式,即在唤醒状态下随时都可以进行语音交互的一种模式。与半双工的最大区别是对话的自由性更多由用户来控制,用户可以随时打断对话状态并开启下一轮交互。
然而,发明人在实现本申请的过程中发现,现有技术中的全双工语音对话方法至少存在以下技术问题:
无法定位情景:无法对应到用户正处的情景中,用户已经开启了第二个话题,但系统还在第一个话题的逻辑中跟用户交互。原因可能是由于网络不稳定等因素,在交互过程中有时候系统还没给用户反馈,而这个时候用户已经开始下一个话题的交互了,从而导致系统跟用户的交互不在同一个话题中。
无法区别对待:有些用户说话语速比较快,有些用户语速比较慢,在全双工模式下经常对用户所说的话理解一半就开始交互从而导致交互体验下降。原因可能在于全双工一开始的定位就是即在唤醒状态下随时都可以进行语音交互的一种模式,从而导致只要有语义命中就开始交互。
发明内容
本申请实施例提供一种全双工语音对话方法及系统,用于至少解决上述技术问题之一。
第一方面,本申请实施例提供一种全双工语音对话方法,用于语音对话终端,所述方法包括:
当所述语音对话终端被唤醒之后,开始录制并上传音频至云端服务器,用于所述云端服务器确定答复内容以及为确定所述答复内容所分析的音频的第一时长;
所述语音对话终端接收所述云端服务器发送的所述答复内容和所述第一时长;
所述语音对话终端判断所述第一时长与第二时长是否一致,所述第二时长为所述语音对话终端所上传音频的总时长;
当所述第一时长与所述第二时长一致时,所述语音对话终端将所述答复内容呈现给用户。
在一些实施例中,当所述第一时长小于所述第二时长时,确定所述第二时长所对应的录制音频相对于所述第一时长所对应的录制音频所多出的冗余录音片段中是否包含有语音端点;
如果否,则将所述答复内容呈现给用户;
如果是,则舍弃所述答复内容,并等待所述云端服务器发送新的答复内容和新的第一时长。
在一些实施例中,在开始录制音频之后,还包括:对录制音频进行语音端点检测,并存储所检测到的语音端点信息,所述语音端点信息包括语音开始时间点和语音结束时间点;
所述确定所述第二时长所对应的录制音频相对于所述第一时长所对应的录制音频所多出的冗余录音片段中是否包含有语音端点包括:
查询所述语音端点信息以确定是否存在属于所述冗余录音片段的语音开始时间点和语音结束时间点。
第二方面,本申请还提供一种全双工语音对话方法,用于云端服务器,所述方法包括:
接收语音对话终端所上传的录制音频;
实时分析所接收到的录制音频,以确定对应于所述录制音频中所包含的语音内容的答复内容;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910831253.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种常温环境中锰系硫化氢脱除剂的制备方法
- 下一篇:电能交易方法、装置及系统