AI视角:世界模型引领人工智能新风潮
你能想象一群猪和飞机一起在天上飞吗?这在现实里没可能,但通过视频生成模型却能轻松实现。
之所以会出现这样离奇的画面,是因为这些视频生成模型在训练时加入了大量科幻电影等虚构内容。它们的设计目标本来就不是复现真实的物理世界。2026年北京智源大会上,智源研究院院长王仲远用这个例子,让“世界模型”成为了众人关注的焦点。
ChatGPT让人工智能能够学会“组织语言”,而Sora展现了AI在“幻想画面”方面的强大能力,但对很多事情,AI仍然只是“知道结果却不明其中缘由”。
正因如此,这些大模型在实际应用中遇到了发展瓶颈:比如自动驾驶面对复杂路况还是无法完全放权,机器人在不熟悉的环境中出现各种故障……“世界模型”应运而生,目标就是帮助AI更好地理解真实世界的规则。
世界模型被很多学者视为实现通用人工智能(AGI)的核心技术,也是业界突破智能体泛化难题的关键。
今年以来,“世界模型”从学术概念迅速走向应用前沿。1月,吉利发布了WAM世界行为模型;3月,小鹏汽车拿出了X-World;5月,小米也展示了Xiaomi Auto World Model,地平线紧随其后推出HorizonDrive……智能驾驶领域的头部玩家们,几乎都在积极布局这项技术。
与此同时,构建能适应更广泛物理世界的通用世界模型,也成为全球科研人员的研究热点。
斯坦福大学教授李飞飞带领的团队推出了World Labs Marble模型,从3D重建切入,让AI能够理解和还原三维空间;图灵奖获得者杨立昆(Yann LeCun)主导的JEPA系列模型则主张在“表征空间”做预测,路径独特;北京智源研究院同样公开了悟界·Physis-v0.1框架,强调一体化物理状态建模,从物理本源入手尝试因果推理……
关于世界模型到底是什么,学者间看法还不完全一致。王仲远坦言,目前距离真正具备物理世界认知能力的基模型还有很长距离,现在还在初步探索阶段,“接下来三到五年,这个领域会持续快速发展”。
王仲远也指出,世界模型的发展面临不少挑战,比如缺乏真实物理世界的数据、技术路线不够清晰、评估标准尚不完善等等。
“了解什么是智能,从人的角度出发,至今依然没有定论。”中国工程院院士王坚表示,无论中美,学者们都在同一片广阔海域探索。技术创新的本质,始终是工程实际和理论研究的相互作用与推动。中国舆情网
从模仿外形到理解本质,人工智能对真实世界的认知还只是刚刚启程。





