Nvidia的新人工智能 (AI) 技术可以在几秒钟内将 2D 照片转换为 3D 场景,从而使创建像元世界这样的沉浸式虚拟空间与文字处理一样简单。
英伟达最近展示了一种名为 Instant NeRF 的照片方法,它使用计算能力来估计光在现实世界中的表现。它可以将您的旧照片转换为视频游戏场景,也可以用于训练机器人和自动驾驶汽车以了解现实世界物体的大小和形状。
“3D 成像带来了一个全新的转型世界,”在 Nvidia 平台上运行 3D 算法的计算机视觉公司 Visionary.ai 的首席执行官Oren Debbi在电子邮件采访中告诉 Lifewire。“使用 3D,您可以在场景中模拟真实世界的深度,并使图像看起来更加生动和逼真。除了 AR/VR 和工业相机,3D 非常普遍,我们现在看到它被用于几乎所有没有用户甚至知道。”
添加维度
75 年前用宝丽来相机拍摄 的第一张即时照片,旨在以 2D 图像快速捕捉 3D 世界。现在,人工智能研究人员正在研究相反的方向:在几秒钟内将一组静止图像转换为数字 3D 场景。
该过程被称为逆向渲染,它使用 AI 来估计光在现实世界中的表现,使研究人员能够从以不同角度拍摄的少量 2D 图像重建 3D 场景。Nvidia声称它已经开发出一种几乎可以立即完成这项任务的方法。
Nvidia 将这种方法与一种称为神经辐射场或 NeRF 的新技术结合使用。该公司表示,该结果被称为 Instant NeRF,是迄今为止最快的 NeRF 技术。该模型只需要几秒钟就可以训练几十张静态照片,然后可以在几十毫秒内渲染生成的 3D 场景。
Nvidia 图形研究副总裁 David Luebke 在一次“从这个意义上说,Instant NeRF对 3D 的重要性可能不亚于数码相机和 JPEG 压缩对 2D 摄影的重要性——极大地提高了 3D 捕获和共享的速度、易用性和范围。”
收集数据以提供给 NeRF 需要神经网络捕获从场景周围多个位置拍摄的几十张图像,以及每个镜头的相机位置。
NeRF 训练一个小型神经网络,通过预测从 3D 空间中的任何点向任何方向辐射的光的颜色来重建场景。
3D 的魅力
增强现实 (AR) Perceptus 平台的创始人Brad Quinton在电子邮件采访中告诉 Lifewire,元界 是 3D 场景非常有用的一个领域,因为它们可以从任何相机角度观看。就像我们可以在现实生活中穿过一个房间并从许多不同的角度看到它的内容一样,通过重建的 3D 场景,我们可以虚拟地穿过一个空间并从任何角度查看它。
“这对于创建用于虚拟现实的环境特别有用,”昆顿说。
Apple 的 Object Capture 等程序使用一种称为摄影测量的技术从一系列 2D 图像中创建虚拟 3D 对象。Quinton 预测,3D 模型将广泛用于虚拟现实和 AR 应用。例如,一些人工智能,如Perceptus AR 平台中的人工智能,使用 3D 模型来创建对现实世界的理解,从而允许实时 AR 应用程序。
Debbi 说,使用 3D 图像还可以模拟场景中的真实世界深度,使图像看起来更加生动逼真。要创建散景效果(又名肖像模式或电影模式),需要 3D 深度映射。该技术几乎用于所有智能手机。
“这已经是专业摄影师拍摄电影的标准,并且正在成为每个消费者的标准,”Debbi 补充道。
免责声明:本文由用户上传,如有侵权请联系删除!