[发明专利]一种基于语音识别的AR交互系统和方法在审
申请号: | 201910049725.2 | 申请日: | 2019-01-18 |
公开(公告)号: | CN109841217A | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 刘雨松 | 申请(专利权)人: | 苏州意能通信息技术有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/30;H04L29/06;G06F3/01 |
代理公司: | 上海宣宜专利代理事务所(普通合伙) 31288 | 代理人: | 邹蕾 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运算处理器 语音交互 终端 用户交互信息 交互系统 语音识别 采集 数据采集模块 数据处理模块 数据传输连接 信息技术领域 用户语音信息 语音处理模块 技术空白 交互技术 交互信息 实景数据 实景图像 视频信号 图像生成 现实图像 虚拟 输出 填补 | ||
1.一种基于语音识别的AR交互系统,其特征在于,包括运算处理器终端和AR端,所述运算处理器终端独立于AR端并进行数据传输连接,所述AR端用于采集实景数据和用户交互信息并用于音频与视频信号的输出,所述运算处理器终端用于处理用户交互信息以及将处理结果结合AR端传来的实景图像生成虚拟-现实图像,并将所述虚拟-现实图像和音频信息分别反馈给AR端的视频与音频输出设备。
2.根据权利要求1所述的一种基于语音识别的AR交互系统,其特征在于,所述采集实景数据和用户交互信息包括:采集AR端实时场景图像、周围环境信息、用户的动作信息和用户的语音信息。
3.根据权利要求1所述的一种基于语音识别的AR交互系统,其特征在于,所述AR端包括:数据采集模块、实景采集模块、实景处理模块、语音输出模块和显示模块,其中,
所述数据采集模块用于收集周围空间环境信息、用户的动作和语音信息,所述数据采集模块将采集的信息通过信号连接传输给运算处理器终端处理;
所述实景采集模块连接所述实景处理模块,所述实景采集模块用于采集周围空间的实景图像;
所述实景处理模块用于对采集的空间实景图像进行调整处理,将调整处理后的空间实景图像通过信号连接传输给运算处理器终端作图像生成处理;
所述语音输出模块用于将运算处理器终端中的结果进行语音输出;
所述显示模块用于将运算处理器终端中最终生成的虚拟-现实结合的立体图像作视频输出。
4.根据权利要求3所述的一种基于语音识别的AR交互系统,其特征在于,所述运算处理器终端由数据预处理模块、语音处理模块、数据处理模块、场景生成模块、图像生成模块和存储模块构成,其中,
所述数据预处理模块用于将数据采集模块传来的数据进行实时的跟踪定位,并进行分析处理;
所述语音处理模块用于对数据预处理模块传来的用户语音数据通过基于深度学习的算法进行语音模型的生成和检验;
所述数据处理模块用于分析语音处理模块的结果,根据结果,从存储模块调取相应的知识库和对话库分别作图像输出和语音输出;
所述场景生成模块用于将数据处理模块的结果生成一个虚拟的场景;
所述图像生成模块用于将所述虚拟的场景与所述实景处理模块传来的空间实景图像进行叠加处理并输出给显示模块;
所述存储模块用于存储知识库和对话库,所述知识库和对话库用于存储相关应用场景的数据信息和对话信息。
5.一种基于语音识别的AR交互系统的交互方法,其特征在于,包含以下步骤:
S1、构建知识库与对话库,将相关应用场景的对话库存储于存储模块中;
S2、开启运算处理器终端和AR端,并且保证二者通信模块之间的可靠传输;
S3、用户佩戴AR设备,用户调整位置,如行走等,能够感受到虚拟场景和真实场景;
S4、用户根据虚拟场景提示或者主动通过音频输入外设,输入语音指令;
S5、通过在运算处理器终端的语音语义等一系列场景控制的处理,用户就会在AR端音频输出设备,通过耳机接收到应答信息,同时从显示设备获取虚拟场景的应答动作和表情。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州意能通信息技术有限公司,未经苏州意能通信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910049725.2/1.html,转载请声明来源钻瓜专利网。