[实用新型]具有文本及语音处理功能的混合现实智能眼镜有效
申请号: | 201721518437.X | 申请日: | 2017-11-14 |
公开(公告)号: | CN207408959U | 公开(公告)日: | 2018-05-25 |
发明(设计)人: | 杜晶;陈清甫;范懿文;张弦 | 申请(专利权)人: | 幻视互动(北京)科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06F17/28;G10L15/26;G06F3/01 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 外部信息 文字信息 语音处理功能 混合现实 智能眼镜 处理器 文本 本实用新型 分散注意力 数据处理器 采集模组 翻译目标 输出模组 双目图像 语音播报 语音采集 综合判断 数字光 翻译 语言 | ||
本实用新型技术方案提供的具有文本及语音处理功能的混合现实智能眼镜,通过深度双目图像采集模组和语音采集输出模组同时获取外部信息,OCR处理器对所述外部信息进行识别,综合判断是否含有文字信息。SLAM处理器结合外部信息,对文字进行定位。数据处理器将文字信息翻译目标语言,根据定位将其在数字光显示呈像装置上进行显示,并同时语音播报。使得用户能够在不分散注意力的情况下接收所需要的翻译或者文字信息。相对于现有技术,避免了用户在接收信息时需要一心二用。
技术领域
本实用新型涉及文本处理技术领域,特别涉及具有文本及语音处理功能的混合现实智能眼镜。
背景技术
翻译文本技术主要应用在桌面电脑端和手机移动端,通常需要用户使用键盘或鼠标,将需要翻译的文字输入到设备中,设备通过离线或在线方式查询出翻译结果,再通过屏幕展现给用户。后续有了屏幕取词的交互方式,它在原有翻译文本技术的基础上增加了识别文本技术。在桌面电脑端即用户使用鼠标指定屏幕中的文字区域,设备自动框定鼠标位置处的文本,将该文本进行翻译;在手机移动端即用户打开摄像头拍摄文本区域,设备通过识别图片或者视频中的文本,再进行翻译。
使用上述应用或设备时大多需要用户手动输入文字或手持设备拍摄等方式进行交互,会打断用户当前正在进行的手头工作,并且以上识别及翻译过程大多是非实时和异步的。进一步,上述识别文本并翻译的技术通常只能针对规范的印刷体文字、背景干净、文本方正无倾斜、文本排版简单等特定情境下有较好的效果,因为随意在自然场景下指定或拍摄的图像可能会遇到背景复杂、视角倾斜导致文本块透视畸变、艺术装饰字体形态和排版复杂等情况,导致文本检测运算量大、文本识别过程噪声大导致误识别,进而导致翻译错误。再次,翻译结果通常以平面的图文显示在设备屏幕或以语音播放,无法以更直观更生动更立体的方式展现。
目前有直接可在近眼数字光显示呈像装置上实时展现虚拟结合的图文声翻译结果的技术方案,但是在一般情况下,用户看翻译或文字识别结果时候,四肢的动作不会停,由于注意力的分散,很可能会不注意周围环境,如果周围环境有障碍物,轻则磕碰,重则导致人身安全。如何能够使用户在注意力不分散的时候接收所需要的翻译或者文字信息成为亟待解决的问题。
实用新型内容
本实用新型的实施例提供具有文本及语音处理功能的混合现实智能眼镜,用于解决现有技术中的问题。
为达到上述目的,本实用新型的实施例采用如下技术方案:
第一方面,本实用新型实施例提供具有文本及语音处理功能的混合现实智能眼镜,第一方面,包括:混合现实智能眼镜至少包括,深度双目图像采集模组,SLAM处理器(SLAM(Simultaneous Localization and Mapping,即时定位与地图构建),数字光显示呈像装置,数据处理器,语音采集输出模组,OCR处理器(Optical Character Recognition,光学字符识别)。深度双目图像采集模组获取外部信息,OCR处理器对所述外部信息进行识别,判断是否含有文字信息;若含有所述文字信息,则所述SLAM处理器结合所述外部信息,对所述文字信息对应的文字进行定位;所述数据处理器将文字信息翻译为用户需要的目标语言,根据定位将其在所述数字光显示呈像装置上进行显示,同时可进行语音播报;其中,所述混合现实智能眼镜至少有一组所述深度双目图像采集模组,所述语音采集输出模组包括:语音输入组件、语音识别组件、语音输出组件。
在第一种可能的实现方式中,结合第一方面的实现方式,所述深度双目图像采集模组获取外部信息,OCR处理器对所述外部信息进行识别,判断是否含有文字信息,具体包括:深度双目图像采集模组拍摄当前环境状态,得到外部信息,所述语音输入组件记录当前环境声音。OCR处理器提取特征库中的文字特征,用于对外部信息进行检测,若检测结果为所述外部信息具有文字特征,则提取文本区域。数据处理器根据文字特征,结合语音识别组件对所述语音输入组件记录的环境声音进行识别,得到语音识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于幻视互动(北京)科技有限公司,未经幻视互动(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201721518437.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:指纹识别模块
- 下一篇:一种指纹识别显示面板及指纹识别显示装置