[发明专利]一种虚拟现实语言交互系统与方法有效
申请号: | 201611193005.6 | 申请日: | 2016-12-21 |
公开(公告)号: | CN108227903B | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 孙其民;李炜 | 申请(专利权)人: | 深圳市掌网科技股份有限公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06K9/00 |
代理公司: | 44217 深圳市顺天达专利商标代理有限公司 | 代理人: | 郭伟刚 |
地址: | 518000 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种虚拟现实语言交互系统与方法,系统包括:语音采集模块,用于周期性的采集音频信号;图像采集模块,用于实时采集用户图像;唇动识别模块,用于基于采集的图像识别出唇动特征;VR交互系统,VR交互系统,用于基于识别出的唇动特征从采集到的音频信号中筛选出有效的音频信号进行语音识别,从而确定虚拟角色的动作指令。本发明通过实时采集用户图像、周期性采集音频信号,基于采集的图像识别出唇动特征,最终基于识别出的唇动特征从采集到的音频信号中筛选出有效的音频信号进行语音识别,从而确定虚拟角色的动作指令,克服了VR头盔中语音输入的局限性,将语音输入与唇动特征相结合,可以准确识别重要声源的语音命令。 | ||
搜索关键词: | 音频信号 交互系统 采集 虚拟现实语言 动作指令 实时采集 图像识别 虚拟角色 用户图像 语音识别 语音 筛选 采集音频信号 图像采集模块 语音采集模块 周期性采集 语音命令 声源 头盔 | ||
【主权项】:
1.一种虚拟现实语言交互系统,其特征在于,包括:/n语音采集模块,用于周期性的采集音频信号;/n图像采集模块,用于实时采集用户图像;/n唇动识别模块,用于基于采集的图像识别出唇动特征;/nVR交互系统,用于基于识别出的唇动特征从采集到的音频信号中筛选出有效的音频信号进行语音识别,从而确定虚拟角色的动作指令;/n其中,所述VR交互系统包括:/n启动单元,用于在语音采集模块采集到音频信号时,判断唇动识别模块是否识别出唇动特征,如果是则判断音频信号有效并触发语音识别单元工作,否则不作处理;/n语音识别单元,用于对采集到的音频信号进行语音识别;/n去噪单元,用于将音频信号中持续存在的低频声音作为环境噪音滤除后再送往语音识别单元进行语音识别;/n有效时域确定单元,用于在每个音频采集周期内,基于唇动识别模块识别出的唇动特征,确定音频采集周期的有效时域,并通知语音识别单元对有效时域内的音频信号进行处理。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市掌网科技股份有限公司,未经深圳市掌网科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611193005.6/,转载请声明来源钻瓜专利网。