[发明专利]一种基于语音和手势的增强现实输入方法及系统在审
申请号: | 201910524878.8 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110413106A | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 邓宝松;刘璇恒;谢良;邓徐韬;闫野;印二威 | 申请(专利权)人: | 中国人民解放军军事科学院国防科技创新研究院;天津(滨海)人工智能军民融合创新中心 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06F3/16;G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100071*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预处理 特征提取 语音 手势 增强现实 采集语音信号 增强现实系统 采集 肌电信号 结果判断 手势识别 手势信号 文本显示 虚拟输入 语音交互 语音识别 肌电 唤醒 文本 | ||
1.一种基于语音和手势的增强现实输入方法,其特征在于,包括如下步骤:
步骤一、采集EMG肌电信号,对采集的EMG肌电信号进行预处理,得到预处理EMG肌电信号;
步骤二、对预处理EMG肌电信号进行特征提取,获取肌电信号;
步骤三、判断有效的肌电信号是否连续输入超过三次:如果是则进入步骤五;否则返回步骤一;
步骤四、唤醒语音输入;
步骤五、采集语音信号,对所述语音信号预处理;
步骤六、对预处理过后的语音信号进行特征提取;
步骤七、语音识别出的文本显示在增强现实眼镜上;
步骤八、采集MEMS手势信号;
步骤九、对所述MEMS手势信号预处理,得到预处理MEMS手势信号;
步骤十、对预处理后的手势信号进行特征提取,得到相应手势识别结果;
步骤十一、手势识别结果如果是取消选择指令,则返回步骤五,否则进入步骤十二;
步骤十二、选择与步骤十一中相应手势识别结果对应文本完成输入。
2.如权利要求1所述的一种基于语音和手势的增强现实输入方法,其特征在于,所述步骤二中,对EMG肌电信号的特征提取为按照最优决策函数f(x)进行特征提取:其中sgn为符号函数,为拉格朗日乘子,b*为偏置参数,*表示所确定的最优决策函数中的最优参数;偏值b如下求解:
其中NNSV为标准支持向量数,JN为标准支持向量的合集,J为支持向量的合集,K(xj,xi)为内积函数;
其中可分数据集D={(xi,yi)|i=1,2,…,n},其中输入向量xi∈Rd,Rd为d维实数平面,目标数据为yi∈{-1,+1},如果xi∈Rd属于第1类,则标记为正,即yi=1,如果属于第2类,则标记为负,即yi=-1。
3.如权利要求2所述的一种基于语音和手势的增强现实输入方法,其特征在于,所述步骤六中,语音信号特征提取包括:
采用BP神经网络算法,用一定数量的样本对神经网络进行训练;
输入语音样本,使用反向传播算法对网络的权值和偏差进行反复的调整训练,使输出的向量与期望向量接近,当网络输出层的误差平方和小于误差阈值时训练完成,保存网络的权值和偏差。
4.如权利要求3所述的一种基于语音和手势的增强现实输入方法,其特征在于,所述步骤十中,具体子步骤包括:
选用Bakis类型HMM分别对各个手势动作进行建模,并初始化模型参数λi=(A,B,π),λi为第i个手势模型,A为隐含状态的转移概率矩阵,B为观测状态概率分布,π为初始状态概率分布向量;
分别反复采集各个手势动作信号的数据,并利用Baum-Welch算法来对手势模型λi进行训练,使模型参数趋于收敛,得出对应手势的最优λi;
选用Viterbi算法作为各个手势对应的HMM识别方法,将输入手势的加速度特征序列分别与训练好的λi进行计算评估,取其概率输出最大的λi为对应手势动作的识别结果。
5.如权利要求4所述的一种基于语音和手势的增强现实输入方法,其特征在于,所述步骤一、步骤五、步骤八中,采用异步控制的策略来输出控制指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事科学院国防科技创新研究院;天津(滨海)人工智能军民融合创新中心,未经中国人民解放军军事科学院国防科技创新研究院;天津(滨海)人工智能军民融合创新中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910524878.8/1.html,转载请声明来源钻瓜专利网。