[发明专利]语音交互的方法、装置、电子设备及存储介质有效
申请号: | 202010530888.5 | 申请日: | 2020-06-11 |
公开(公告)号: | CN111694433B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 陈世伟 | 申请(专利权)人: | 阿波罗智联(北京)科技有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G10L15/22;G06V40/16;G06V40/20;G06V20/59 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 曹娜 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 装置 电子设备 存储 介质 | ||
本申请公开了语音交互的方法、装置、电子设备及存储介质,涉及语音、自然语言处理和图像处理技术。具体实现方案为:在检测到语音信号中包含交互信息的情况下,根据语音信号的声源位置以及传感器检测到的辅助信息,确定发出语音信号的多个语音交互用户;为语音信号中的交互信息设置标签,标签与发出语音信号的用户的对应。生成对交互信息的反馈信息;向与标签对应的语音交互用户播放反馈信息。解决了多人无法同时进行语音交互的问题,提高了多人情况下的语音交互效率,也增加了语音交互的智能性。
技术领域
本申请涉及信号处理技术领域,尤其涉及语音交互的方法、装置、电子设备及存储介质。
背景技术
在目前市面上的车载语音系统中,只能实现在同一时间下一名乘车人员进行语音交互。当车内其它乘车人员也有语音交互的意图时,就需要等待前一次语音交互结束后,或重新进行语音唤醒,才可以开启新一轮语音交互流程。
发明内容
本申请提供了一种语音交互的方法、装置、电子设备及存储介质,涉及语音技术、自然语言处理、图像处理等领域。
根据本申请的一方面,提供了一种音交互的方法,包括以下步骤:
在检测到语音信号中包含交互信息的情况下,根据语音信号的声源位置以及传感器检测到的辅助信息,确定发出语音信号的多个语音交互用户;
为语音信号中的交互信息设置标签,标签与发出语音信号的语音交互用户对应;
生成对交互信息的反馈信息;
向与标签对应的语音交互用户播放反馈信息。
根据本申请的另一方面,提供了一种音交互的装置,包括以下组件:
语音交互用户确定模块,用于在检测到语音信号中包含交互信息的情况下,根据语音信号的声源位置以及传感器检测到的辅助信息,确定发出语音信号的多个语音交互用户;
标签设置模块,用于为语音信号中的交互信息设置标签,标签与发出语音信号的语音交互用户对应;
反馈信息生成模块,用于生成对交互信息的反馈信息;
反馈信息播放模块,用于向与标签对应的语音交互用户播放反馈信息。
第三方面,本申请实施例提供一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请任意一项实施例所提供的方法。
第四方面,本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本申请任意一项实施例所提供的方法。
根据本申请的技术解决了多人无法同时进行语音交互的问题,提高了多人情况下的语音交互效率,也增加了语音交互的智能性。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的语音交互的方法的流程图;
图2是根据本申请第一实施例的辅助信息确定的流程图;
图3是根据本申请第一实施例的语音交互用户确定的流程图;
图4是根据本申请第一实施例的播放反馈信息的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿波罗智联(北京)科技有限公司,未经阿波罗智联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010530888.5/2.html,转载请声明来源钻瓜专利网。