[发明专利]语音交互实现方法、装置及电子设备在审
申请号: | 202010580431.5 | 申请日: | 2020-06-23 |
公开(公告)号: | CN111755003A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 张银平;汪俊杰;杨琳;徐培来;张传良 | 申请(专利权)人: | 北京联想软件有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L25/51;H04L29/06 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 姚璐华 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 实现 方法 装置 电子设备 | ||
本申请提出了一种语音交互控制方法、装置及电子设备,第一电子设备进行语音帧连续采集过程中,获取当前语音帧的激活分数以及增强语音帧,检测到所获取的激活分数达到第一激活阈值但未达到第二激活阈值时,将激活标记、采集时间点以及相应的增强语音帧构建成第一增强语音包发送至第二电子设备,第二电子设备会禁止输出携带激活标记的第一增强语音包,避免了该时间段接收到的可能为激活词的增强语音帧输出后,对接听用户造成干扰,降低在线语音交互质量;若预设采集时间段内获取的激活分数达到第二激活阈值,第二电子设备将输出在第一增强语音包中激活词的结束时间点之后获取的增强语音帧,以保证第一电子设备与第二电子设备之间的正常通话交流。
技术领域
本申请主要涉及多方通话应用领域,更具体地说是涉及一种语音交互实现方法、装置及电子设备。
背景技术
目前,大部分电子设备配置有语音识别引擎(如语音助手),并针对该语音识别引擎配置相应的激活词,用以激活该语音识别引擎进入工作状态,这样,用户可以直接说针对电子设备的语音控制指令,即可控制电子设备执行预设操作,无需用户手动操作,非常方便。
然而,在电子设备应用于如会议、游戏等场景下,实现多用户在线语音交流过程中,电子设备采集到本地用户的语音信息后,无论在语音信息是否包含语音识别引擎的激活词,目前都是直接发送至其他用户的电子设备输出,从而导致本地用户所说的针对本地电子设备的激活词,对其他用户造成干扰,降低了在线语音通话质量,影响用户体验。
发明内容
有鉴于此,为了解决现有技术本地用户所说的针对本地电子设备的激活词,对其他用户造成干扰,降低了在线语音通话质量的技术问题,一方面,本申请提供了一种语音交互控制方法,所述方法包括:
在语音帧连续采集过程中,获取采集的当前语音帧的激活分数及增强语音帧,所述激活分数能够表示当前已采集到的语音帧包含第一电子设备的语音识别引擎的激活词的概率;
检测所述激活分数达到第一激活阈值但未达到第二激活阈值,确定所述当前语音帧的类型标记为激活标记,由相应的增强语音帧、采集时间点及所述激活标记构建第一增强语音包;
将所述第一增强语音包发送至第二电子设备,以使所述第二电子设备禁止输出所述第一增强语音包,直至在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定得到的第一增强语音包中激活词的结束时间点;
由所述结束时间点之后获取的增强语音帧及相应的采集时间点构建第二增强语音包,将所述第二增强语音包发送至所述第二电子设备输出。
可选的,所述在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定携带有所述激活标记的增强语音包中激活词的结束时间点,包括:
在预设采集时间段内获取的激活分数达到所述第二激活阈值,确定在所述预设采集时间段内采集到的语音帧包含所述语音识别引擎的激活词,生成相应的激活检测结果;
将所述激活检测结果发送至所述第二电子设备,以使所述第二电子设备从所述预设采集时间段内接收到的第一增强语音包中,确定激活词的结束时间点;
接收所述第二电子设备反馈的所述结束时间点。
可选的,所述方法还包括:
获取所述当前语音帧的减弱语音帧;
在所述确定所述当前语音帧的类型标记为激活标记的情况下,所述方法还包括:
由所述当前语音帧的减弱语音帧、采集时间点及所述激活标记构建第一减弱语音包;
将所述第一减弱语音包发送至所述第二电子设备,以使得所述第二电子设备输出所述第一减弱语音包。
可选的,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京联想软件有限公司,未经北京联想软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010580431.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:仿真环境下的多核任务处理方法及装置
- 下一篇:一种外币业务处理方法及装置