[发明专利]基于语音的人机交互方法、系统、电子设备及介质在审

申请号：	202111384136.3	申请日：	2021-11-19
公开（公告）号：	CN114067779A	公开（公告）日：	2022-02-18
发明（设计）人：	张胜田;杨斌	申请（专利权）人：	广东东软学院
主分类号：	G10L15/00	分类号：	G10L15/00;G10L15/02;G10L15/22
代理公司：	成都顶峰专利事务所(普通合伙) 51224	代理人：	陈秋霞
地址：	528000 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于语音人机交互方法系统电子设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于语音的人机交互方法，其特征在于：包括：

进行静音检测，并判断是否接收到包括唤醒词的第一语音数据，若是，则唤醒当前电子设备，并进入下一步；

获取声源位置信息，并根据声源位置信息输出方位调整指令，以便当前电子设备调整至与声源相对的位置；

输出与唤醒词对应的应答信息，然后实时检测是否接收到第二语音数据，并在接收到第二语音数据后对其进行识别，得到语音指令；

对语音指令进行响应。

2.根据权利要求1所述的一种基于语音的人机交互方法，其特征在于：当前电子设备设置有两个具有一指定间隔的语音采集模块，两个语音采集模块均用于采集第一语音数据；

获取声源位置信息，包括：

根据两个语音采集模块采集的第一语音数据，得到两个初始采集信号；

对两个初始采集信号分别进行预处理，得到两个处理后采集信号；

计算两个处理后采集信号对应的自功率谱函数及互功率谱函数，并根据自功率谱函数及互功率谱函数得到HB加权函数；

根据HB加权函数得到两个语音采集模块接收信号的时延估计值，再根据两个语音采集模块接收信号的时延估计值，得到声源的位置信息。

3.根据权利要求2所述的一种基于语音的人机交互方法，其特征在于：两个初始采集信号为：

式中，a(t)和a(t-t₀)分别为两个语音采集模块采集的第一语音数据，t₀为两个语音采集模块接收语音数据的时间差，m₁和m₂为声波传播衰减因子(m₁、m₂均小于1)，n₁和n₂为环境噪音；

对两个初始采集信号分别进行预处理，得到两个处理后采集信号，包括：

对两个初始采集信号进行反正切变换，得到两个处理后采集信号；其中，两个处理后采集信号为：

式中，arctan[·]为反正切函数，k为控制非线性变换程度的参数，k0。

4.根据权利要求3所述的一种基于语音的人机交互方法，其特征在于：所述HB加权函数为：

；

式中，、分别为两个处理后采集信号对应的自功率谱函数，为两个处理后采集信号对应的互功率谱函数；

根据HB加权函数得到两个语音采集模块接收信号的时延估计值，再根据两个语音采集模块接收信号的时延估计值，得到声源的位置信息，包括：

对互功率谱函数进行HB加权，得到广义互功率谱函数；其中，广义互功率谱函数为：

；

对广义互功率谱函数进行累计加权，得到互相关函数；其中，互相关函数为：

，积分范围为全数字频率；

式中，互相关函数累计函数为：

式中，n为帧数，为不同频率的正弦序列，j为虚部符号，w为数字频率，t为时间；

获取互相关函数的峰值，并根据互相关函数的峰值得到两个语音采集模块接收信号的时延估计值；

根据两个语音采集模块接收信号的时延估计值，得到声源的位置信息。

5.根据权利要求1所述的一种基于语音的人机交互方法，其特征在于：所述静音检测包括：实时检测是否接收到超过第一音量阈值的第一语音数据;

实时检测是否接收到第二语音数据，包括：实时检测是否接收到超过第二音量阈值的第二语音数据。

6.根据权利要求1所述的一种基于语音的人机交互方法，其特征在于：当前电子设备设置有距离检测模块，所述距离检测模块用于检测当前电子设备与声源之间的距离；

获取声源位置信息，并在当前电子设备调整至与声源相对的位置后，所述基于语音的人机交互方法还包括：

获取声源距离信息，并根据声源距离信息输出音量调节指令，以便当前电子设备调节输出语音的音量大小。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东东软学院，未经广东东软学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111384136.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载