[发明专利]对大物品拍照有效
申请号: | 200680037171.5 | 申请日: | 2006-10-04 |
公开(公告)号: | CN101283375A | 公开(公告)日: | 2008-10-08 |
发明(设计)人: | A·O·阿加瓦拉;M·阿加瓦拉;M·F·科恩;D·H·赛尔辛;R·塞里斯基 | 申请(专利权)人: | 微软公司 |
主分类号: | G06T1/00 | 分类号: | G06T1/00;G06T1/20;G06T17/00;G06T15/00 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 陈斌 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物品 拍照 | ||
发明背景
对诸如较长的城市街道的边沿或较大的游船的边沿等大型现象的描绘难以用照相机来创建。例如,从街道的对侧拍摄的建筑物的单张透视照片仅捕捉了可能延伸许多街区的街道的很短的一部分。具有更宽视场的照片将捕捉到该街道的略长的一部分,但是该街道的外观将表现为朝向图像的边缘越来越失真。捕捉大型场景的一种解决方案是从远得多的地方拍照。然而,由于居间的物体(诸如在城市街区的情况中),这并不总是可行的,并且这将产生看上去与当人类沿街道行走时将看到的街道外观相当不同的图像。由于局部观察者从更近的视点看到街道,因此透视缩短更显著;遮阳蓬随着其从观察者的位置开始延伸而变得更小,并且交叉路口随着其从观察者开始延伸而会聚。从远处的视点所拍摄的图像丢失了这些有用的深度提示。
先前的工作引入了照片图像拼接的概念,照片图像拼接一般是从一系列照片中组装单张照片的过程。通常,假设所有照片都是从同一视点对同一物品进行拍摄的,但是有些东西在改变,例如,如果是一组照片,则不同的人在任何特定的时刻可能在微笑或不在微笑。因此,可采用这一过程来选取出所有正在微笑的人来组装较好的图像。底层技术处理图形剪切,这建立了你所希望的某种目标函数(例如,微笑的人),并且系统将检查来自输入图像的像素并选择最好的像素。然而,该系统不能很好地处理移动照相机。在大多数情况下,输入图像必须来自静止照相机,或最多绕其光轴旋转。
多视角(multi-perspective)图像长期以来被艺术家用于描绘大型场景。可能在古代中国卷轴绘画中能找到最早的示例,该卷轴绘画用多个透视图来讲述跨越空间和时间的故事。Kubovy[1986]描述了可在许多文艺复兴绘画中找到的多视角效果,并解释了主要动机是避免大型场景中尤其在边缘处看上去奇怪的透视失真。例如,这些绘画中的人通常是从直接在其前方的视点来描绘的,即使这些人远离图像的中心。否则,他们将以不悦目的方式被拉长。最近,艺术家Michael Koller创建了旧金山街道的多视角图像。该图像由线性透视照片的多个区域构成,这些区域被巧妙地缝合在一起以隐藏转变。城市街区的每一建筑物看上去与如果实际直接站在该建筑物前方所看到的大致相同。
如上所述,多视角图像并不是新的;它们可在古代和现代艺术中,以及计算机图形和视觉研究中都找的到。然而,创建可视化大型场景的多视角图像的一个困难一般并没有被良好定义。例如,如果该场景是完全平面的,则该场景可被建模为具有单个纹理图的矩形,并且理想输出将很一般地是该纹理图。然而,在变化深度的世界中,产生视差问题。视差指的是当观察者移动时,较靠近观察者的物体显现为比离观察者较远的物体移动得更快这一事实。由此,从具有变化深度的世界的移动的视点拍摄的图像在其重叠区域中并没有对齐。
各项研究也已探索了对多视角成像的多种使用。例如,几个研究院[Agrawala等人2000;Yu和McMillan 2004;Glassner 2000]探索了来自3D模型的多视角图像的呈现。多视角图像也被用作便于生成传统透视图的数据结构[Wood等人1997;Rademacher和Bishop 1998],然而,使用所捕捉的图像的研究较不流行。Kasser和Egels[2002]对摄影测量进行了大量研究,摄影测量是从关于照片的测量中推导物体的物理维度的科学,这些测量包括图像中描绘的三维世界中的物体,以及当拍摄图像时照相机的位置和方向。在该工作中,航天或卫星图像被缝合在一起以创建地球的接近正交的、从上到下的视图。然而,这一工作并未解决描绘三维场景的图像的困难,因为三维场景引入了透视缩短和视差难题,而这是正交图像中不需要处理的。
并且,连续变化视点的图像不能通过合成来自每一帧的带而从由连续移动的照相机捕捉的视频中创建;示例包括推式路帚全景(pushbroom panorama)[Gupta和Hartley 1997;Seitz和Kim 2002]、自适应流形(adaptive manifold)[Peleg等人2000]、以及x狭缝图像[Zomet等人2003]。推式路帚全景可用于可视化诸如街道等长场景,然而,这些图像通常看上去与人类在观看该场景时察觉到的相当不同。推式路帚全景在水平方向上具有正交透视图,而在垂直方向上具有常规的透视图。由此,交叉路口不会会聚到一点,并且在变化深度的物体将被非均匀地拉长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680037171.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:主动式IP地址分配方法及系统
- 下一篇:无线传感网的多频点通信方法