跟随系统

浅色模式

深色模式

马斯克xAI加速布局“世界模型”：剑指下一代AI，挑战Meta与谷歌

互联网
下午8:42
3 分钟阅读

北京时间10月12日，据英国《金融时报》报道，埃隆·马斯克旗下人工智能公司xAI正全力推进其“世界模型”的研发，与Meta、谷歌等科技巨头同台竞技，争夺下一代AI系统的主导权。这类前沿系统被寄予厚望——不仅能自主理解物理环境，还能实现复杂场景的导航与设计，被视为突破大语言模型局限的关键方向。

“世界模型”为何重要？下一代AI的“物理感知引擎”

根据英伟达官方定义，世界模型是一种生成式AI，其核心能力在于理解现实世界的动态特性（包括物理规律与空间关系），并能通过文字、图像、视频及动作等多模态输入生成连贯的动态内容（如影片）。简单来说，它让AI不再局限于文本交互，而是能“感知”并模拟真实世界的运行逻辑。当前主流的大语言模型（如ChatGPT、xAI自家的Grok）主要依赖文本训练，虽在语言理解与生成上表现卓越，却缺乏对物理世界的直观认知。而世界模型通过学习视频数据及机器人传感器信息，能更深入地理解现实世界的运作机制，被视为将AI能力从“数字交互”推向“实体交互”的关键跳板。

xAI的“挖角行动”：英伟达专家加盟，瞄准游戏与机器人

为加速这一前沿技术的突破，xAI已从英伟达招募两名关键人才——AI研究员泽尚・帕特尔（Zeeshan Patel）与何宜晖（Ethan He）。值得注意的是，英伟达凭借其Omniverse平台（可创建并运行高精度模拟环境），长期在世界模型技术领域保持领先地位，这两位专家的加入无疑为xAI注入了核心技术基因。据两位知情人士透露，xAI正研发的世界模型计划率先应用于游戏领域，目标是生成可交互的3D虚拟环境，为玩家提供更沉浸式的体验。此外，这类模型未来也可能拓展至机器人AI系统，赋予机器人更强的环境适应与决策能力。马斯克曾在X（原推特）上公开表示，xAI计划在2025年年底前推出“一款由AI生成的优质游戏”，再次印证了其在游戏场景的野心。

技术突破：从“逐帧预测”到“因果理解”的跨越

当前主流视频生成模型（如OpenAI的Sora）主要通过分析训练数据中的模式规律，逐帧预测并生成视频图像，虽能呈现逼真画面，却难以真正理解物理世界的因果关系。而世界模型的优势在于，它能实时推理物体在不同环境中的互动逻辑，例如“球滚动后会因摩擦力减速”“杯子掉落时会因重力破碎”等，从而生成更符合现实逻辑的动态内容。这一技术跃迁被多家科技公司视为AI应用的“破圈”契机——未来，AI的能力可能从软件、计算机延伸至实体产品，如人形机器人、自动驾驶汽车等，推动AI真正融入物理世界。

挑战重重：数据稀缺与行业质疑并存

尽管前景广阔，世界模型的研发仍面临巨大挑战。首要难题是数据获取——要构建足够丰富且真实的训练数据以模拟物理世界，不仅难度极高，成本也极为昂贵。《博德之门3》开发商拉瑞安工作室的发行主管迈克尔・道斯本周在X上直言，游戏行业当前的核心问题并非“算法生成的玩法循环”，而是缺乏能让玩家真正投入的“世界呈现方式”，间接反映了对纯技术驱动内容创新的谨慎态度。与此同时，谷歌、Meta等科技巨头也在加速布局同类系统，竞争日趋白热化。xAI虽已推出最新升级的图像与视频生成模型（免费向用户开放），但要在世界模型领域实现突破，仍需克服技术、数据与商业化落地的多重难关。截至发稿，xAI及新加入的两位英伟达专家尚未就此事公开回应。这场围绕“世界模型”的竞赛，或将重新定义下一代AI的边界。

资讯

上一篇

国内最常用的AI助手

下一篇

中国市值 TOP50 公司（含海外上市）

评论列表 (0条)：

加载更多评论 Loading...

延伸阅读:

暂无内容!