[发明专利]用于多模态神经符号场景理解的系统和方法在审
申请号: | 202210184892.X | 申请日: | 2022-02-28 |
公开(公告)号: | CN114972727A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | J·弗朗西斯;A·奥尔特拉马里;C·谢尔顿;S·穆尼尔 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06N3/02;G06N5/04;G06T1/20;G06V20/52 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 刘书航;刘春元 |
地址: | 德国斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 多模态 神经 符号 场景 理解 系统 方法 | ||
1.一种用于图像处理的系统,包括:
第一传感器,被配置为捕获至少一个或多个图像;
第二传感器,被配置为捕获声音信息;
与第一传感器和第二传感器通信的处理器,其中所述处理器被编程为:
接收所述一个或多个图像和所述声音信息;
利用编码器提取与图像和声音信息相关联的一个或多个数据特征;
经由解码器向时空推理引擎输出元数据,其中利用解码器和所述一个或多个数据特征导出元数据;
利用时空推理引擎和元数据确定一个或多个场景;和
响应于所述一个或多个场景输出控制命令。
2.根据权利要求1所述的系统,其中,所述时间推理引擎与领域本体数据库通信,并且利用所述领域本体数据库来确定所述一个或多个场景。
3.根据权利要求2所述的系统,其中,所述领域本体数据库包括指示利用所述元数据的一个或多个场景的信息。
4.根据权利要求2所述的系统,其中,所述领域本体数据库存储在与所述处理器通信的远程服务器处。
5.根据权利要求1所述的系统,其中,所述系统包括被配置为捕获温度信息的第三传感器,并且所述处理器与第三传感器通信,并且接收温度信息并从温度信息提取相关联的一个或多个数据特征。
6.根据权利要求1所述的系统,其中,所述处理器进一步被编程为在输出元数据之前融合与图像和声音信息相关联的一个或多个数据特征。
7.根据权利要求1所述的系统,其中,所述处理器进一步被编程为将与图像和声音信息相关联的一个或多个数据特征分离地提取到多个解码器。
8.根据权利要求1所述的系统,其中,所述解码器与机器学习网络相关联。
9.一种用于图像处理的系统,包括:
第一传感器,被配置为捕获指示环境的第一信息集;
第二传感器,被配置为捕获指示环境的第二信息集;
与第一传感器和第二传感器通信的处理器,其中所述处理器被编程为:
接收指示环境的第一信息集和第二信息集;
利用编码器提取与图像和声音信息相关联的一个或多个数据特征;
经由解码器向时空推理引擎输出元数据,其中利用解码器和一个或多个数据特征导出元数据;
利用时空推理引擎和元数据确定一个或多个场景;和
响应于所述一个或多个场景输出控制命令。
10.根据权利要求9所述的系统,其中,第一信息集和第二信息集具有不同类型的数据。
11.根据权利要求9所述的系统,其中,第一传感器包括温度传感器、压力传感器、振动传感器、湿度传感器或二氧化碳传感器。
12.根据权利要求9所述的系统,其中,所述处理器进一步被编程为在利用所述编码器提取所述一个或多个数据特征之前,预处理指示环境的第一信息集和第二信息集。
13.根据权利要求9所述的系统,其中,所述系统包括融合模块,所述融合模块用于融合来自第一信息集和第二信息集的融合数据集。
14.根据权利要求13所述的系统,其中,元数据是从融合数据集提取的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210184892.X/1.html,转载请声明来源钻瓜专利网。