蚂蚁发布万亿参数思考模型综合能力逼近GPT-5

日期：10-20

字号：大 中 小

版面：第A14版：民生上一篇 下一篇

晨报讯（南京晨报/爱南京记者杨静）日前，蚂蚁集团正式推出万亿参数思考模型Ring-1T，并全面开源模型权重、训练配方。Ring-1T在9月30日开源的预览版Ring-1T-preview基础上，持续扩展大规模可验证奖励强化学习（RLVR）训练，进一步激发万亿基座的自然语言推理能力，并通过RLHF训练完善模型通用能力，在各项任务榜单上表现更加均衡。

为了持续激发Ring-1T的数学等复杂推理能力，此次百灵团队挑战了难度更高的IMO2025（国际数学奥利匹克）赛题，将Ring-1T接入多智能体框架AWorld，使用纯自然语言推理进行解题。实验结果显示，Ring-1T仅用一次解出了第1、3、4、5题，相当于IMO银牌水平，成为首个能拿IMO国际奥数奖的开源系统。作为一款思考模型，Ring-1T也表现出了极佳的通用能力，在“人类偏好对齐”测试Arena-Hard V2中，Ring-1T以81.59的成功率居于开源模型榜首，逼近GPT-5-Thinking（High）82.91的成绩。

在Ring-1T模型中，蚂蚁采用了自研的“棒冰（icepop）”算法来应对这项行业难题，即用带掩码的双向截断技术把训练-推理分布差异冻结在低水位，确保长序列、长周期训练不崩。

据了解，截至目前，蚂蚁百灵大模型已经发布18款模型，已形成从160亿总参数到1万亿总参数的大语言模型产品矩阵，其中两款万亿参数模型—万亿参数通用大语言模型Ling-1T、万亿参数思考模型Ring-1T。随着两款万亿参数模型的发布，百灵大模型也正式步入2.0阶段。

蚂蚁发布万亿参数思考模型 综合能力逼近GPT-5

日期：10-20 字号：大中小 版面：第A14版：民生 上一篇 下一篇

蚂蚁发布万亿参数思考模型综合能力逼近GPT-5

日期：10-20

字号：大中小

版面：第A14版：民生上一篇下一篇