(原标题:用AI生成3D世界!“AI教母”李飞飞最新访谈:空间智能是我的“北极星”,和语言智能一样重要)
9月21日,风险投资公司安德森·霍洛维茨公司(AndreessenHorowitz,简称a16z)发布了一期重磅访谈视频。a16z普通合伙人马丁·卡萨多(MartinCasado)与WorldLabs的两位领军人物——被誉为“AI教母”的李飞飞以及她曾经的学生贾斯汀·约翰逊(JustinJhonson)展开了一场精彩对话。
此次访谈重点讨论了AI的历史进程、当前挑战以及未来突破,特别是“空间智能”这一领域的潜力和应用。
回顾AI发展:从“寒冬”到“大爆发”
李飞飞在访谈中首先回顾了人工智能的发展历程。她表示,尽管许多人对那个时期的AI发展持悲观态度,称之为“AI的寒冬”,但她却始终认为这是“春前的冬眠”。
李飞飞形象地描述道,人工智能正经历着“大爆发”式的快速发展。她强调,当前的AI已经不仅限于文本处理,在音频、视频等多模态领域也正在迅速崛起,这为AI带来了无数的可能性。
贾斯汀则通过自己的学术经历,回顾了深度学习的兴起,并强调算力的飞速提升对AI发展的关键作用:“算力的增长是惊人的,以前需要6天才能完成的任务,现在只需要不到5分钟就能完成。”他用具体的例子说明,随着技术的发展,AI的能力在几何级数上攀升。
空间智能:3D世界的AI革命
作为此次对话的核心话题之一,李飞飞和贾斯汀深刻剖析了“空间智能”的革命性潜力。李飞飞定义道:“空间智能是机器在3D空间和时间中感知、推理和行动的能力。”
李飞飞表示,视觉空间智能是她的“北极星”。她指出,空间智能与语言智能一样重要,甚至在某些方面可能更古老、更基础。她还提到,AI的发展不会局限于处理平面图像或文本,而是会迈向对三维世界的理解,这是智能发展的自然延伸。
贾斯汀进一步解释了空间智能与传统基于语言的AI之间的差异:“语言模型的底层表示是一维的,但世界是三维的。我们认为,世界的三维特性应该在表示中占据核心地位。”他认为,空间智能不仅仅是对图像或视频的2D处理,而是通过3D模型来推动机器理解物理世界的本质。
李飞飞还从进化的角度阐述了空间智能的重要性:“智能的进化使动物,尤其是人类,能够在世界中移动,与世界互动,甚至创造文明。这种能力不仅仅是感知二维世界,更是理解并应对三维的真实物理环境。”
“视觉智能是我的激情所在,因为我相信每一个智能生物,如人类、机器人或其他形式,都必须具备看待世界、推理世界和与世界互动的能力。”李飞飞进一步解释,空间智能不仅是技术上的突破,更是构建未来AI生态的关键。
李飞飞强调,当前的计算能力更加成熟,数据理解比以往更深入,算法进展迅速,正是探索空间智能的关键时刻。
应用场景:虚拟与现实世界融合
当谈及空间智能的潜在应用时,贾斯汀表示:“未来的AI不仅能生成图像或视频,还能创建一个充满活力和交互性的3D世界。”他设想,空间智能能够应用在游戏、教育、虚拟摄影等多个领域,甚至开启一种全新的媒体形式。这不仅降低了3D内容制作的成本,还可能会激发更多的沉浸式体验。
李飞飞则补充了增强现实(AR)和虚拟现实(VR)的应用场景。她提到:“这种技术将成为AR/VR的‘操作系统’,帮助人类增强能力。”
她举例说,未来,佩戴AR眼镜的人可能不需要任何专业技能,就能修理汽车或完成复杂的操作。她认为,通过空间智能,虚拟世界与现实世界的融合将大大增强人类与机器的互动能力。
贾斯汀指出,随着这项技术的成熟,未来我们可能不再需要使用手机、平板等不同尺寸的屏幕。他表示:“如果你能够将虚拟内容与物理世界无缝融合,那么对所有这些屏幕的需求就会减少。”
李飞飞还提到了苹果发布的VisionPro。她笑称,“就在WorldLab成立的时候,苹果发布了VisionPro。苹果使用了‘空间计算’这个词,几乎是‘偷’了我们的名字,我们是‘空间智能’。”
迈向“北极星”的旅程
在对话的最后,马丁·卡萨多问及如何衡量空间智能的成功。李飞飞表示:“当我们看到越来越多的企业和用户开始使用我们的模型来解锁他们的需求时,那将是我们到达一个重要里程碑的时刻。”但她也指出,追逐技术的“北极星”是一场永无止境的旅程,空间智能的未来充满了无限可能。
贾斯汀则认为,空间智能的终极目标是理解宇宙的四维结构,技术的每一次突破都会开启更多的未知领域:“我们永远不会到达终点,但这正是技术魅力所在。”