[发明专利]基于音频频域特征的对话过程捂嘴手势识别方法有效

专利信息
申请号: 202011131535.4 申请日: 2020-10-21
公开(公告)号: CN112259124B 公开(公告)日: 2021-06-15
发明(设计)人: 喻纯;李竹 申请(专利权)人: 交互未来(北京)科技有限公司
主分类号: G10L25/51 分类号: G10L25/51;G06F3/16;G06F21/32;H04R1/08;H04R1/10
代理公司: 北京君莫知识产权代理事务所(普通合伙) 11715 代理人: 崔云鹤
地址: 100015 北京市朝阳区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 音频 特征 对话 过程 手势 识别 方法
【权利要求书】:

1.一种基于音频频域特征的对话过程捂嘴手势识别方法,所述方法应用于基于语音接收组件和移动终端实现的语音输入过程,其特征在于,

所述方法包括如下步骤:

S1:建立所述语音接收组件与所述移动终端的无线通信;

S2:响应于所述移动终端开启语音输入的操作,所述语音接收组件通过第一语音监测通道和第二语音监测通道接收语音输入信号;

S3:所述第一语音监测通道将接收的第一语音输入信号发送至所述移动终端;

S4:所述移动终端基于内置的声纹识别模型判断当前语音输入是否为授权用户输入;

如果是,则进入步骤S5;

如果否,则返回步骤S2;

S5:所述第二语音监测通道将接收的第二语音输入信号发送至所述移动终端;

S6:所述移动终端基于所述第一语音输入信号和所述第二语音输入信号各自的音频频域特征比对,进行所述捂嘴手势识别;

其中,所述步骤S6进一步包括:

提取出所述第一语音输入信号和所述第二语音输入信号各自包含用户语音的片段;

计算所述第一语音输入信号和所述第二语音输入信号各自包含用户语音的片段的迁移函数,将所述迁移函数的参数值作为表征音频信号通路差别的特征值;

将上述特征值输入到经数据训练后的机器学习模型中,模型输出判别用户当前是否维持捂嘴手势。

2.如权利要求1所述的一种基于音频频域特征的对话过程捂嘴手势识别方法,其特征在于:

所述移动终端包括手机、平板电脑、可穿戴设备之一或者其组合;

所述语音接收组件包括单耳耳机。

3.如权利要求1所述的一种基于音频频域特征的对话过程捂嘴手势识别方法,其特征在于:

所述步骤S4中所述移动终端基于内置的声纹识别模型判断当前语音输入是否为授权用户输入,具体包括:

预先在所述移动终端中注册授权用户正常状态下的声纹特征信号;

将所述第一语音输入信号进行音频频域特征处理后,得到多个音频频域特征;

判断所述音频频域特征与所述声纹特征信号是否满足匹配条件,如果满足,则所述当前语音输入为授权用户输入。

4.如权利要求3所述的一种基于音频频域特征的对话过程捂嘴手势识别方法,其特征在于:

将所述第一语音输入信号进行音频频域特征处理后,得到多个音频频域特征,具体包括如下步骤:

S41:通过高通滤波器对所述第一语音输入信号进行预加重处理,所述高通滤波器的传递函数为:H(z)=1-αz-1,其中,0<α<1;z为传递函数变量;

S42:采用滑动时间窗口对所述进行预加重处理后的第一语音输入信号进行分帧;

所述滑动时间窗口函数表达式如下:

N为每一帧的长度;

S43:采用谱减法对所述分帧后的序列进行去噪;

S44:对所述去噪后的序列进行端点检测,获取每两个相邻端点之间的音频频域特征。

5.如权利要求1所述的一种基于音频频域特征的对话过程捂嘴手势识别方法,其特征在于:

所述步骤S6中所述移动终端基于所述第一语音输入信号和所述第二语音输入信号各自的音频频域特征比对,进行所述捂嘴手势识别,具体包括如下步骤:

S61:通过人声检测算法(Voice Acticity Dection)提取出所述第一语音输入信号和所述第二语音输入信号各自包含用户语音的片段;

S62:将所述第一语音输入信号和所述第二语音输入信号各自包含用户语音的片段对齐;

S63:通过傅里叶变换和梅尔倒谱计算方法提取表征音频片段频率特征的特征值,并对于音频片段的平均幅度进行计算;

S64:比较两路音频上述特征的差异,若音量差异以及频率差异超过一定阈值,则判定为用户在语音输入的同时维持了朝向麦克的捂嘴手势。

6.如权利要求4所述的一种基于音频频域特征的对话过程捂嘴手势识别方法,

其特征在于:

所述步骤S42采用滑动时间窗口对所述进行预加重处理后的第一语音输入信号进行分帧后,相邻帧序列重叠的序列长度D满足如下条件:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于交互未来(北京)科技有限公司,未经交互未来(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011131535.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top