大模型竞赛告别规模比拼

来源：中国舆情网时间：2025-12-04

导读：随着大模型技术不断进步，人们开始关注是否有方法能够科学评估人工智能大模型的“智能水平”。近期，清华大学的科研团队提出了“大模型密度法则”这一新概念，并在《自然·机器智能》期刊上发表了相关成果。密度法则揭示了，当前大语言模型的能力密度正以指

随着大模型技术不断进步，人们开始关注是否有方法能够科学评估人工智能大模型的“智能水平”。近期，清华大学的科研团队提出了“大模型密度法则”这一新概念，并在《自然·机器智能》期刊上发表了相关成果。密度法则揭示了，当前大语言模型的能力密度正以指数速度增长——自2023年2月至2025年4月，大约每3.5个月就实现一次倍增。

在计算机领域，大家都熟知“摩尔定律”，即每隔一段时间，芯片上的晶体管数量就会翻倍。芯片能够变得更强大，并非体积增大，而是因为在很小的面积内集成了庞大的计算单元。清华大学计算机科学与技术系的肖朝军指出，大模型的智能能力同样需要一个量化指标，这正是“能力密度”。

研究团队基于一个核心假设进行探索——不同规模但采用相同工艺、经过充分训练的大模型，在能力密度方面是趋同的。类似于芯片行业通过提升集成密度实现性能提升和普及化，AI大模型也在通过增加能力密度提升效能。

肖朝军解释，过去业界主要关注模型参数的数量，认为参数越多模型越强大，这类似于只关注举重选手的体重。如今，密度法则则强调应关注模型单位参数所蕴含的智能水平，类似于武术高手的修为，不在于肌肉大小，而是每一招中所体现的功底。

在对近几年发布的51个主流开源大模型进行系统研究后，团队发现，大模型的最大能力密度正以极快的速度提升。自2023年以来，每3.5个月能力密度就能翻倍。也就是说，随着数据、算力和算法持续迭代，未来用更少的参数也能实现同等智能表现。

他们还进一步分析，发现同等智能水平下，模型推理的资源消耗也在迅速下降。ChatGPT发布前，能力密度需要约4.8个月翻倍，而发布后仅需3.2个月，提升速度增加了50%。这反映出大模型技术日益成熟，开源生态活跃，推动能力密度不断突破。

肖朝军认为，能力密度提升带来的直接效益是模型变得更智慧，对算力的需求更低，运行成本随之下降。在这一新规律的引导下，学术界和工业界也能开展技术创新，让AI大模型实现更加广泛的落地应用。

从实际应用来看，密度法则意味着AI技术的可用性不断增强。肖朝军介绍，随着芯片电路和模型能力密度加速提升，未来大型模型有望从云端走向终端设备。在用户本地运行大模型不仅能提升响应速度，还能保护隐私，为用户提供更加丰富和个性化的服务。

以智能汽车为例，过去大模型在车载系统中只是简单完成诸如“打开车窗”“查找餐厅”等任务。随着端侧模型的应用，车辆能凭借丰富的感知和理解能力，实现多模态环境融合和自主决策，让智能座舱由“被动响应”迈向“主动服务”，进一步提升驾驶体验。

记者张盖伦

编辑：夏蕊娜

上一篇：首次揭示导致溃疡性结肠炎的关键致病机制
下一篇：国家启动新兴产业示范基地建设工作