中国舆情网手机客户端工作人员查询
中国舆情网官网二维码

舆情网官网

中国舆情网手机二维码

舆情网手机

您的当前位置:主页 > 动态资讯 > 正文
中国舆情网-一带一路BANNER

大模型竞赛告别规模比拼

来源:中国舆情网 时间:2025-12-04
导读:随着大模型技术不断进步,人们开始关注是否有方法能够科学评估人工智能大模型的“智能水平”。近期,清华大学的科研团队提出了“大模型密度法则”这一新概念,并在《自然·机器智能》期刊上发表了相关成果。密度法则揭示了,当前大语言模型的能力密度正以指

随着大模型技术不断进步,人们开始关注是否有方法能够科学评估人工智能大模型的“智能水平”。近期,清华大学的科研团队提出了“大模型密度法则”这一新概念,并在《自然·机器智能》期刊上发表了相关成果。密度法则揭示了,当前大语言模型的能力密度正以指数速度增长——自2023年2月至2025年4月,大约每3.5个月就实现一次倍增。

在计算机领域,大家都熟知“摩尔定律”,即每隔一段时间,芯片上的晶体管数量就会翻倍。芯片能够变得更强大,并非体积增大,而是因为在很小的面积内集成了庞大的计算单元。清华大学计算机科学与技术系的肖朝军指出,大模型的智能能力同样需要一个量化指标,这正是“能力密度”。

研究团队基于一个核心假设进行探索——不同规模但采用相同工艺、经过充分训练的大模型,在能力密度方面是趋同的。类似于芯片行业通过提升集成密度实现性能提升和普及化,AI大模型也在通过增加能力密度提升效能。

肖朝军解释,过去业界主要关注模型参数的数量,认为参数越多模型越强大,这类似于只关注举重选手的体重。如今,密度法则则强调应关注模型单位参数所蕴含的智能水平,类似于武术高手的修为,不在于肌肉大小,而是每一招中所体现的功底。

在对近几年发布的51个主流开源大模型进行系统研究后,团队发现,大模型的最大能力密度正以极快的速度提升。自2023年以来,每3.5个月能力密度就能翻倍。也就是说,随着数据、算力和算法持续迭代,未来用更少的参数也能实现同等智能表现。

他们还进一步分析,发现同等智能水平下,模型推理的资源消耗也在迅速下降。ChatGPT发布前,能力密度需要约4.8个月翻倍,而发布后仅需3.2个月,提升速度增加了50%。这反映出大模型技术日益成熟,开源生态活跃,推动能力密度不断突破。

肖朝军认为,能力密度提升带来的直接效益是模型变得更智慧,对算力的需求更低,运行成本随之下降。在这一新规律的引导下,学术界和工业界也能开展技术创新,让AI大模型实现更加广泛的落地应用。

从实际应用来看,密度法则意味着AI技术的可用性不断增强。肖朝军介绍,随着芯片电路和模型能力密度加速提升,未来大型模型有望从云端走向终端设备。在用户本地运行大模型不仅能提升响应速度,还能保护隐私,为用户提供更加丰富和个性化的服务。

以智能汽车为例,过去大模型在车载系统中只是简单完成诸如“打开车窗”“查找餐厅”等任务。随着端侧模型的应用,车辆能凭借丰富的感知和理解能力,实现多模态环境融合和自主决策,让智能座舱由“被动响应”迈向“主动服务”,进一步提升驾驶体验。

记者 张盖伦

编辑:夏蕊娜
中国舆情网
中国舆情网
中央机构 | 人大机构 | 国家主席 | 国务院 | 政协机构 | 民主党派 | 群众团体 | 驻外机构
Copyright © 2010-2018 中国舆情网 版权所有 | 中国舆情网简介
网络文化经营许可证 广播电视节目制作经营许可证 电信增值业务经营许可证
编辑:tougao@yuqingz.com 运营:operate@yuqingz.com
本网站所刊载信息,不代表中国舆情网观点。转载本网站原创信息请注明出处。
网站地图 | XML地图 | 手机版 | 电脑版
Top