世界太小,不够世界模型们用了
日期:2025-12-10 15:28:19 / 人气:9

在当今AI领域,“世界模型”概念异常火爆,但也陷入了混乱的局面,不同大佬对其定义和实现路径各执一词,尽管存在分歧,但他们都认为世界模型是通往通用人工智能(AGI)的必经之路,而大语言模型(LLM)发展已到瓶颈。
世界模型概念的混乱根源
概念定义的演变与分歧
“世界模型”的思想最早可追溯到1943年认知科学家Kenneth Craik提出的“心智模型”,即大脑通过构建外部世界的微缩模型来进行预测。20世纪90年代该理论被引入强化学习,而真正让其在现代AI领域受到关注的是Jürgen Schmidhuber等人在2018年发表的论文,该论文首次系统定义了神经网络世界模型的框架,当时它还是由视觉组件(VAE)、记忆组件(RNN)和控制器构成的具体架构,用于简陋的赛车游戏和二维类射击游戏训练。
随着大语言模型的爆发,对通用人工智能的渴望使“世界模型”概念在近两年迅速衍生。Yann LeCun在2022年提出以世界模型为核心的“自主智能”,并在2023年、2024年推出I - JEPA、V - JEPA预测模型;李飞飞在2024年提出“空间智能”理念,创办World Labs并发布Marble;OpenAI前首席科学家Ilya Sutskever提到的“压缩即智能”也与之相关。一个抽象概念衍生出更多抽象概念,不同人对世界模型有不同的理解和定义。
技术路线的两大流派
从技术方向来看,当前世界模型主要分为表征派(Representation)与生成派(Generation)。
表征派的代表人物是Yann LeCun,这是一条极简主义路线。类比人脑中的心智模型,我们对世界的预测和行动往往是直觉性的,而非基于物理公式或具体画面。LeCun的世界模型是一个深藏在系统后端的“大脑”,在表征处理后的潜在空间里运作,预测的是“抽象状态”。他明确定义世界模型需同时输入四个变量来预测下一时刻的世界状态,关键在于预测“状态”而非画面,且能针对连续动作交互进行因果推断。该模型不追求视觉逼真,只为了给机器做决策,追求逻辑上的因果推演,像I - JEPA和V - JEPA都摒弃了生成式AI“预测每一个像素”的做法,避免浪费算力在不可预测的噪音细节上。
生成派是目前声量最大的流派,与表征派核心区别在于要重建、模拟视觉世界。他们引用物理学家Richard Feynman的名言,认为只要模型能生成正确的世界,就证明它懂了世界的物理规律。OpenAI的Sora被认为是世界模拟器,它通过学习数十亿视频片段,预测下一帧像素,试图涌现出对物理规律的理解,但被质疑无法回应动作与世界状态的因果律,可能只是记住了“球飞行的轨迹概率”而非理解“力学定律”。生成派衍生出互动式生成视频(Interactive Generative Video),如谷歌DeepMind发布的Genie 3,它具有实时性、可交互性,允许用户进入场景并与之互动,支持生成实时画面,理解动作与环境变化的因果关系,但目前动作仅限于方向按键的上下左右。李飞飞主张的“3D空间智能”以World Labs发布的Marble为代表,它试图从底层构建一个持久的、可下载的3D环境,技术底座接近“3D高斯泼溅”,将世界表征为成千上万个彩色模糊小斑点,通过微粒聚合渲染出精美三维画面,允许用户生成、改造并导出到引擎中,注重建立高精度的物理准确的3D空间。
如今,凡是涉及环境理解与模拟的上下游工程,如具身智能、自动驾驶、游戏视频等领域,甚至做视觉信息压缩的技术,都和世界模型挂上了钩,使得“世界模型”概念外延被无限扩大。
世界模型热潮背后的原因
资本焦虑与技术瓶颈下的泡沫
在创投圈,叙事往往比代码更值钱。当“大语言模型”竞争格局已定,后来者和垂直应用开发者急需新故事打动投资人。“视频生成模型”听起来天花板有限,而改名为“世界模型”就上升到AGI的高度。科研人员大规模下场创办公司,学术与商业重叠,原本严谨的科研定义之争在商业世界被放大,不同定义对应不同的算力投入方向、产业链备货和投资人的价值重构,导致世界模型概念被滥用,存在巨大泡沫成分。
反LLM中心主义的运动
整个AI行业对大语言模型产生集体性的技术焦虑。LLM是“离身”的,在纯文本的符号系统中训练,虽知道词语间的关联,但从未真正“看见”事物,无法理解物理现象,且随着数据规模扩大,AI提升的边际效益递减。Ilya Sutskever强调“超越大模型”,李飞飞提出“空间智能”,核心都是让AI从学习“人类说的话”转向学习“世界发生的事”,行业正从单纯的文本处理转向对物理现实的模拟与交互,世界模型被视为通往AGI的关键,是对LLM中心主义的一种反抗。
然而,在世界模型真正出现之前,需要警惕这个概念被过度消费和玩坏。
作者:奇亿娱乐
新闻资讯 News
- 世界太小,不够世界模型们用了12-10
- 世间再无周金涛:康波理论的中国...12-10
- AI眼镜“跨界风暴”:理想汽车的...12-10
- 百度的冬天,或许才刚刚开始:巨...12-10

