[发明专利]用于自动地生成用于媒体文档的元数据的系统和方法有效
申请号: | 201780061114.9 | 申请日: | 2017-08-11 |
公开(公告)号: | CN109791554B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 卡洛·戴穆托;艾尔维斯·梅莫;德·阮;阿巴斯·拉斐;傑森·崔裘斯基 | 申请(专利权)人: | 派克赛斯有限责任公司 |
主分类号: | G06F16/41 | 分类号: | G06F16/41 |
代理公司: | 北京泰吉知识产权代理有限公司 11355 | 代理人: | 张雅军;顾以中 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 自动 生成 媒体 文档 数据 系统 方法 | ||
根据本发明的一个实施例,用于自动地生成用于媒体文档的元数据的方法包含:使用卷积神经网络来计算所述媒体文档的特征向量;搜索媒体文档集合以用于具有与所述媒体文档的所述特征向量类似的相应特征向量的一或多个匹配媒体文档,所述媒体文档集合的每一媒体文档与元数据相关联;基于与所述一或多个匹配媒体文档相关联的所述元数据来生成用于所述媒体文档的元数据;以及显示与所述所生成元数据相关联的所述媒体文档。
相关申请的交叉参考
本申请主张2016年8月12日在美国专利商标局提交的美国临时专利申请第62/374,598号的益处,所述申请的全部公开以引用的方式并入本文中。
技术领域
本发明的实施例的方面涉及包含图像和3D模型标记和分类的数字媒体标记和分类领域,以及相关用户界面系统。
背景技术
例如图像、音频、录音和视频的各种类型的数字媒体文档通常包含元数据,所述元数据包含数字媒体文档的文本描述。这种元数据可包含例如时戳的信息,以及相关数字媒体文档的内容的标记和/或叙述描述。这些元数据可在基于搜索来执行文本时使用,以便识别与搜索查询相关的媒体文档。元数据还可用以对数字媒体文档进行归类或分类。
作为一个实例,与数字相片相关联的元数据可包含例如图像尺寸(在像素方面)和图像色深的技术信息以及描述相片内容的元数据。与森林中的徒步旅行者的照片相关联的元数据可包含照片内容的文本描述,例如“林地”、“森林”、“树木”、“植物”、“绿色”、“阴影”、“花”、“徒步旅行(hike)”、“徒步旅行者”、“徒步旅行(hiking)”等。
三维(3D)模型是数字媒体文档的另一种形式,且普遍用于诸如广告、质量控制、视频游戏、虚拟现实和增强现实应用的情形中。在过去,3D模型通过使用(例如)计算机辅助设计(CAD)工具而手动地生成。一般来说,形成这些模型是劳动密集型任务,尤其当形成详细模型时。近年来,深度相机和3D扫描器已提供了替代方法,其中详细的3D模型可通过对真实物理物体的形状的数字捕获而形成。
使用CAD工具、深度相机和3D扫描器生成的三维模型还可得益于元数据标记。举例来说,3D模型可用于电子商务网站上的产品列表中,且与3D模型相关联的元数据可用于生成或填充相关产品列表中的信息。举例来说,车辆的3D模型可包含元数据信息,例如汽车的品牌和型号、内部和外观颜色、状况(例如,存在凹痕或损坏)以及类似元数据信息。这些元数据可添加到产品列表中的信息,使得购物者可搜索呈特定颜色的特定类型的汽车。
然而,手动地生成这些用于每一3D模型的元数据可能耗费时间,且可能产生不一致和排列组织不良的结果。举例来说,汽车可能标记为“红色”,而红色色调的实际名称可能是“红宝石色”。关于车辆的其它信息也可能不正确,例如特定型号的名称的拼写。
发明内容
本发明的实施例的方面是关于具有元数据的自动增强三维(3D)模型,以及用于采集和生成那些3D模型的系统。
根据本发明的一个实施例,用于自动地生成用于媒体文档的元数据的方法包含:使用卷积神经网络来计算媒体文档的特征向量;搜索媒体文档集合以用于具有与媒体文档的特征向量类似的相应特征向量的一或多个匹配媒体文档,所述媒体文档集合中的每一媒体文档与元数据相关联;基于与一或多个匹配媒体文档相关联的元数据来生成用于媒体文档的元数据;以及显示与所生成元数据相关联的媒体文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于派克赛斯有限责任公司,未经派克赛斯有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780061114.9/2.html,转载请声明来源钻瓜专利网。