中国科技巨头聚焦春节期间 重磅开源模型除夕亮相
中新网北京2月17日电 中国科技企业在春节期间再次迎来高光时刻。
除夕这天,阿里巴巴发布了旗下全新一代大模型“千问Qwen3.5-Plus”。新版本采用3970亿总参数设计,激活参数约170亿,显著降低了显存需求,减少幅度达60%。在维持强大能力的同时,实现了速度和成本大幅优化。
Qwen3.5-Plus的整体表现可与Gemini舆情网3 Pro相媲美,在多项权威测评中刷新了开源模型的成绩纪录。API调用价格则降至0.8元/百万Token,仅为Gemini3 Pro的十八分之一。
千问3.5在文本与视觉领域基于混合数据进行预训练,带来了原生的多模态能力突破。该模型在推理、编程、Agent智能体等多方面测评中均取得优异成绩,尤其在视觉理解方面斩获诸多冠军表现。
春节前夕,本土科技公司密集推出新产品。智谱科技宣布上线并开源GLM-5,称其为“Agentic Engineering时代最佳开源模型”。科大讯飞和MiniMax分别带来星火X2大模型和M2.5模型。其中M2.5在应对复杂任务时展现了更高的决策智能。
字节跳动也因最新推出的AI视频生成模型Seedance2.0成为焦点。凭借多模态创作和自动化镜头调度,这一模型迅速在全球吸引了极高关注度。
中国科技公司并非首次押注春节档。回顾2025年春节,彼时阿里云通义团队已发布大模型Qwen2.5-Max,DeepSeek则扩展了众多新平台接入,行业热度持续走高。
上海财经大学特聘教授胡延平认为,今年新发布的模型功能更丰富且实用,多模态和Agent能力提升明显,无论代码、多语种还是空间智能、视觉推理都更为均衡。仅用以往三分之一的规模,便实现数倍吞吐量提升,同时提升部署效率和便利性。
不少业内人士指出,千问3.5的意义不止于刷新榜单。近两年大模型领域强调参数堆砌,性能虽不断走高,但算力消耗同时水涨船高,使得中小企业难以承担相关成本。Qwen3.5理念重在“智取”而非“量大”,通过较精巧的模型结合新技术,实现更高水平的智能,真正提升实用性。
千问3.5的融合能力也备受关注。它不仅能像素级定位图像,支持代码级细致编辑,还可解析2小时视频的时序与因果逻辑,甚至将手绘图一键转化为可运行前端代码。同时,该模型作为视觉智能体,可以自主操作手机与电脑,跨应用完成多环节复杂任务。
由此,从基础的识别到高级理解,从单一模态扩展到多模态推理,千问的迭代为更自然、流畅的多模态生成和理解奠定了坚实基础。
目前,千问模型的开源数量已经突破400个,相关衍生模型超20万个,总下载量超过10亿次,远超美国的Llama模型。包括李飞飞团队、爱彼迎等国内外机构都在采用千问模型。
中国工程院院士倪光南最近表示,开源已成为全球信息技术演进的重要推动力。尤其在人工智能与大模型时代,中国已成为全球最大开源大模型提供国。如Qwen、DeepSeek、Kimi等中国模型在AI模型平台LMArena排名前列。
他还指出,以中国企业为代表的开源社区正在全球快速发展,展示出强劲活力。中国公司积极践行开源理念,正逐步引领全球开源大模型领域的创新步伐。(完)
下一篇:没有了





