[发明专利]包括聚类的眼戴器在审
申请号: | 202180038624.0 | 申请日: | 2021-05-24 |
公开(公告)号: | CN115668105A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 乔纳森·格迪斯;詹妮卡·庞兹;瑞安·普鲁登;乔纳森·M·罗德里格斯二世;安德烈·瑞宾 | 申请(专利权)人: | 美国斯耐普公司 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06F40/58;G06F18/23 |
代理公司: | 北京市中联创和知识产权代理有限公司 11364 | 代理人: | 李倩倩;王铮 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 包括 眼戴器 | ||
本发明提供了一种眼戴设备,所述眼戴器通过将口语分割成属于不同的说话者并且在会话过程中记住所述说话者来执行聚类。每个说话者的语音被翻译为文本,并且每个说话者的所述文本被显示在眼戴显示器上。每个用户的所述文本具有不同的属性,使得所述眼戴器用户可区分不同的说话者的所述文本。所述文本属性的示例可为文本颜色、字体和字体大小。所述文本被显示在所述眼戴显示器上,使得所述文本基本上不遮挡所述用户的视野。
相关申请的交叉引用
本申请要求于2020年5月28日提交的名称为“包括聚类的眼戴器”的美国专利申请序列号16/885,606的优先权,该专利申请的内容全文以引用方式并入本文。
技术领域
本主题涉及一种眼戴设备,例如,智能眼镜。
背景技术
现今可获得的便携式眼戴设备,诸如智能眼镜、头饰和头戴器,集成了相机和透视显示器。
附图说明
附图仅以示例的方式而不是以限制的方式描绘了一个或多个具体实施。在附图中,相同的附图标记表示相同或相似的元素。
图1A是眼戴设备的示例性硬件配置的侧视图,其示出了具有图像显示器的右光学组件,并且基于检测到的用户的头部或眼睛移动对呈现在图像显示器上的用户界面应用视场调整;
图1B是图1A的眼戴设备的镜腿的顶部横截面图,其描绘了可见光相机、用于追踪眼戴设备的用户的头部移动的头部移动追踪器和电路板;
图2A是眼戴设备的示例性硬件配置的后视图,该眼戴设备包括框架上的眼睛扫描仪,该眼睛扫描仪在系统中用于识别眼戴设备的用户;
图2B是另一眼戴设备的示例性硬件配置的后视图,该另一眼戴设备包括镜腿上的眼睛扫描仪,该眼睛扫描仪在系统中用于识别眼戴设备的用户;
图2C和图2D是包括两种不同类型的图像显示器的眼戴设备的示例性硬件配置的后视图。
图3示出了图2A的眼戴设备的后透视图,其描绘了红外发射器、红外相机、框架前部、框架后部和电路板;
图4是穿过图3的眼戴设备的红外发射器和框架的横截面图;
图5示出了检测眼睛注视方向;
图6示出了检测眼睛定位;
图7描绘了由左可见光相机捕获的可见光作为左原始图像以及由右可见光相机捕获的可见光作为右原始图像的示例;
图8A示出了基于相机的补偿系统,其识别图像中的对象(诸如牛仔),将识别出的对象转换为文本,然后将文本转换为指示图像中识别出的对象的音频;
图8B示出了图像(诸如餐馆菜单),其具有可经由语音指示要处理并大声读出给用户的部分;
图8C示出了对语音执行聚类并以文本显示会话,该文本显示在眼戴显示器上;
图9示出了眼戴设备的电子部件的框图;
图10是眼戴设备的操作的流程图;并且
图11是使用聚类以在眼戴显示器上显示与多个说话者相关联的文本的算法的流程图。
具体实施方式
本公开包括眼戴器,所述眼戴器通过将口语分割成属于不同的说话者并且在会话过程中记住所述说话者来执行聚类。每个说话者的语音被翻译为文本,并且每个说话者的所述文本被显示在眼戴显示器上。每个用户的所述文本具有不同的属性,使得所述眼戴器用户可区分不同的说话者的所述文本。所述文本属性的示例可为文本颜色、字体和字体大小。所述文本被显示在所述眼戴显示器上,使得所述文本基本上不遮挡所述用户的视野。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美国斯耐普公司,未经美国斯耐普公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180038624.0/2.html,转载请声明来源钻瓜专利网。