[发明专利]基于语音的人机交互方法、系统、电子设备及介质在审
申请号: | 202111384136.3 | 申请日: | 2021-11-19 |
公开(公告)号: | CN114067779A | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 张胜田;杨斌 | 申请(专利权)人: | 广东东软学院 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/02;G10L15/22 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 陈秋霞 |
地址: | 528000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 人机交互 方法 系统 电子设备 介质 | ||
本发明涉及人机交互技术领域,其目的在于提供一种基于语音的人机交互方法、系统、电子设备及介质。其中,基于语音的人机交互方法包括:进行静音检测,并判断是否接收到包括唤醒词的第一语音数据,若是,则唤醒当前电子设备,并进入下一步;获取声源位置信息,并根据声源位置信息输出方位调整指令,以便当前电子设备调整至与声源相对的位置;输出与唤醒词对应的应答信息,然后实时检测是否接收到第二语音数据,并在接收到第二语音数据后对其进行识别,得到语音指令;对语音指令进行响应。本发明可提高用户与电子设备之间进行人机交互的用户体验。
技术领域
本发明涉及人机交互技术领域,特别是涉及一种基于语音的人机交互方法、系统、电子设备及介质。
背景技术
人机交互是指人与电子设备之间使用某种对话语言,以一定的交互方式,为完成确定任务的人与电子设备之间的信息交换过程。其中,基于语音的人机交互,由于不需用户与电子设备直接接触,只需用户发出语音信息即可实现与电子设备的交互动作,有效解放了用户双手,极大程度增加了用户操作的便捷性。
现有技术中,基于语音的人机交互可以分为远场语音交互和近场语音交互,其中,远场语音交互与近场语音交互相比,远场语音交互过程中,用户与电子设备的距离较远,通常在一米到十米之间,从而使得远场语音交互更适用于大型的公共场合。
但是,在使用现有技术过程中,发明人发现现有技术中至少存在如下问题:
现有技术中,电子设备的朝向通常固定设置,造成用户在需要与电子设备进行人机对话时,需要用户移动至电子设备设置有语音输出模块及电子显示屏的正面相对面,由此便于用户听清电子设备的输出语音并看清电子显示屏的显示画面,造成用户体验不佳。
发明内容
本发明旨在至少在一定程度上解决上述技术问题,本发明提供了一种基于语音的人机交互方法、系统、电子设备及介质。
本发明采用的技术方案是:
第一方面,本发明提供了一种基于语音的人机交互方法,包括:
进行静音检测,并判断是否接收到包括唤醒词的第一语音数据,若是,则唤醒当前电子设备,并进入下一步;
获取声源位置信息,并根据声源位置信息输出方位调整指令,以便当前电子设备调整至与声源相对的位置;
输出与唤醒词对应的应答信息,然后实时检测是否接收到第二语音数据,并在接收到第二语音数据后对其进行识别,得到语音指令;
对语音指令进行响应。
在一个可能的设计中,当前电子设备设置有两个具有一指定间隔的语音采集模块,两个语音采集模块均用于采集第一语音数据;
获取声源位置信息,包括:
根据两个语音采集模块采集的第一语音数据,得到两个初始采集信号;
对两个初始采集信号分别进行预处理,得到两个处理后采集信号;
计算两个处理后采集信号对应的自功率谱函数及互功率谱函数,并根据自功率谱函数及互功率谱函数得到HB加权函数;
根据HB加权函数得到两个语音采集模块接收信号的时延估计值,再根据两个语音采集模块接收信号的时延估计值,得到声源的位置信息。
在一个可能的设计中,两个初始采集信号为:
式中,a(t)和a(t-t0)分别为两个语音采集模块采集的第一语音数据,t0为两个语音采集模块接收语音数据的时间差,m1和m2为声波传播衰减因子(m1、m2均小于1),n1和n2为环境噪音;
对两个初始采集信号分别进行预处理,得到两个处理后采集信号,包括:
对两个初始采集信号分别进行预处理,得到两个处理后采集信号,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东东软学院,未经广东东软学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111384136.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种管道更新掘进机
- 下一篇:一种利用铝灰制取微氮脱氧合金的方法