[发明专利]用于地理位置预测的系统和方法在审
申请号: | 201980046711.3 | 申请日: | 2019-01-10 |
公开(公告)号: | CN112424769A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | A.戈班;Y.吴 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06K9/00 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 地理位置 预测 系统 方法 | ||
1.一种用于从影像中提取信息的计算机实施的方法,所述方法包括:
在包括一个或多个处理器的计算系统处,获得表示图像序列的数据,所述图像序列中的至少一个图像描绘对象;
由所述计算系统将所述图像序列输入到被训练成从所述图像序列中提取位置信息的机器学习信息提取模型中;以及
由所述计算系统获得作为信息提取模型响应于输入所述图像序列的输出的、表示与所述图像序列中描绘的所述对象相关联的真实世界位置的数据。
2.根据权利要求1所述的计算机实施的方法,其中获得表示与所述图像序列中描绘的所述对象相关联的所述真实世界位置的所述数据包括:
由所述计算系统确定表示与图像帧序列中描绘的所述对象相关联的分类的数据;
由所述计算系统至少部分地基于表示从所述图像序列中提取的图像特征序列的数据,来确定与所述图像序列相关联的时间注意力值和空间注意力值;以及
由所述计算系统至少部分地基于所述图像特征序列、时间注意力值和空间注意力值来预测与所述对象相关联的所述真实世界位置。
3.根据权利要求2所述的计算机实施的方法,其中确定与所述图像序列相关联的所述时间注意力值和所述空间注意力值包括:
由所述计算系统将所述图像特征序列输入到弱监督对象分类模型中,其中对象分类模型包括至少一个长短期记忆块;以及
由所述计算系统获得作为所述对象分类模型响应于输入所述图像特征序列的输出的所述时间注意力值和所述空间注意力值。
4.根据权利要求2或3所述的计算机实施的方法,其中确定与所述图像帧序列中描绘的所述对象相关联的所述分类包括:
由所述计算系统将所述图像特征序列输入到弱监督对象分类模型中;以及
由所述计算系统获得作为对象分类模型响应于输入所述图像特征序列的输出的与所述对象相关联的所述分类。
5.根据权利要求4所述的计算机实施的方法,其中表示所述图像帧序列的所述数据包括与所述图像帧序列相关联的至少一个分类标签,并且所述方法还包括:
由所述计算系统至少部分地基于与所述图像序列相关联的所述至少一个分类标签,来确定与由所述对象分类模型输出的所述分类相关联的损失;以及
由所述计算系统至少部分地基于所确定的损失来训练所述对象分类模型。
6.根据权利要求2、3、4或5所述的计算机实施的方法,其中预测与所述对象相关联的所述真实世界位置包括:
由所述计算系统将所述图像特征序列、所述时间注意力值和所述空间注意力值输入到帧级位置特征提取模型中;
由所述计算系统获得作为所述帧级位置特征提取模型响应于输入所述图像特征序列、所述时间注意力值和所述空间注意力值的输出的、表示包括与所述对象相关联的一个或多个位置特征的位置特征序列的数据;
由所述计算系统将所述位置特征序列输入到帧级位置预测模型中;
由所述计算系统获得作为所述帧级位置预测模型响应于输入所述位置特征序列的输出的、表示相机坐标空间中与所述对象相关联的坐标的数据;以及
由所述计算系统至少部分地基于所述相机坐标空间中的所述坐标和与所述对象相关联的相机姿态数据来确定与所述对象相关联的真实世界坐标。
7.根据权利要求6所述的计算机实施的方法,还包括:
由所述计算系统至少部分地基于与跨描绘所述对象的所述图像序列中的多个图像的所述对象相关联的坐标之间的方差来确定位置一致性损失;以及
由所述计算系统至少部分地基于所述位置一致性损失来训练所述帧级位置预测模型。
8.根据权利要求6或7所述的计算机实施的方法,还包括:
由所述计算系统至少部分地基于跨描绘所述对象的所述图像序列中的多个图像而确定的外观特征之间的方差来确定外观一致性损失;以及
由所述计算系统至少部分地基于所述外观一致性损失来训练所述帧级位置预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980046711.3/1.html,转载请声明来源钻瓜专利网。