[发明专利]语音交互方法及装置在审
申请号: | 202011458115.7 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112767931A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 谢家晖;刘永红 | 申请(专利权)人: | 广东美的白色家电技术创新中心有限公司;美的集团股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/30 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 瞿璨 |
地址: | 528311 广东省佛山市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 装置 | ||
本申请公开了一种语音交互方法及装置。其中,该语音交互方法包括:响应于语音交互用户从第一空间进入第二空间,完成语音识别上下文继承,语音识别上下文继承是通过位于第一空间的第一语音设备所采集语音交互用户的第一语音所实现;与位于第二空间的第二语音设备交互,并且通过语音识别上下文继承对语音交互用户的第二语音进行识别和/或交互,第二语音由第二语音设备所采集。本申请语音交互方法能够保证跨空间的延续性语音识别和/或交互。
技术领域
本申请涉及语音交互技术领域,特别是涉及一种语音交互方法及装置。
背景技术
随着语音识别技术的日趋成熟,语音设备的语音交互功能正在快速的加强和改进。目前,主要通过单设备远场语音识别方法解决用户在同一空间内的远场交互问题。单设备的远场语音识别要求用户和语音设备之间尽可能地没有遮挡,语音设备拾音能维持一定信噪比的情况下进行。但是,当用户从相邻空间A走到B,中间出现墙壁隔断的时候,直射传播路径被切断,导致设备拾音信噪比大幅降低,远场语音识别将无法正常工作。
发明内容
本申请提供一种语音交互方法及装置,以实现跨空间的延续性语音交互和/或识别。
为达到上述目的,本申请提供一种语音交互方法,该方法包括:
响应于语音交互用户从第一空间进入第二空间,完成语音识别上下文继承,语音识别上下文继承是通过位于第一空间的第一语音设备所采集语音交互用户的第一语音所实现;
与位于第二空间的第二语音设备交互,并且通过语音识别上下文继承对语音交互用户的第二语音进行识别和/或交互,第二语音由第二语音设备所采集。
其中,响应于语音交互用户从第一空间进入第二空间之前,包括:
通过第一语音设备获得语音交互用户的第一行为信息,通过第二语音设备获得语音交互用户的第二行为信息;
基于第一行为信息和第二行为信息确认语音交互用户是否从第一空间进入第二空间。
其中,基于第一行为信息和第二行为信息确认语音交互用户是否从第一空间进入第二空间,包括:
基于第一行为信息和第二行为信息确认语音交互用户是否发生跨空间行为;
响应于语音交互用户发生跨空间行为,获取第二语音;基于第二语音和第一语音确认两者对应的语音交互用户相同,则语音交互用户从第一空间进入第二空间;或,
响应于语音交互用户发生跨空间行为,获取第二语音对应的语音交互用户的身份;确认第二语音对应的语音交互用户和第一语音对应的语音交互用户相同,则语音交互用户从第一空间进入第二空间;或,
响应于语音交互用户发生跨空间行为,获取第二语音对应的语音交互用户的身份,则确认语音交互用户从第一空间进入第二空间。
其中,第一行为信息为语音交互用户离开第一空间的时间,第二行为信息为语音交互用户进入第二空间的时间;
基于第一行为信息和第二行为信息确认语音交互用户是否从第一空间进入第二空间,包括:
计算离开第一空间的时间和进入第二空间的时间的差值;
在差值满足预设条件时,语音交互用户发生跨空间行为。
其中,第一语音设备和第二语音设备安装有摄像装置,第一行为信息为包含语音交互用户的第一图像,第二行为信息为包含语音交互用户的第二图像;
基于第一行为信息和第二行为信息确认语音交互用户是否从第一空间进入第二空间,包括:从第一图像检测出语音交互用户;基于实时获取的第一图像和第二图像对语音交互用户进行跟踪,以确定语音交互用户是否从第一空间进入第二空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东美的白色家电技术创新中心有限公司;美的集团股份有限公司,未经广东美的白色家电技术创新中心有限公司;美的集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011458115.7/2.html,转载请声明来源钻瓜专利网。