电子报阅读机
2026-03-22
星期日
当前报纸名称:新华日报

“教”AI“读懂”复杂世界

日期:03-11
字号:
版面:第18版:科技周刊·科技点亮生活       上一篇    下一篇

□ 本报记者 谢诗涵

长期以来,如何让机器理解复杂语义,是人工智能领域的一块“硬骨头”。日前,东南大学计算机科学与工程学院、软件学院、人工智能学院耿新教授团队,凭借在“标记分布学习理论与方法”上的原创性突破,荣获2025年度吴文俊人工智能科学技术奖自然科学奖一等奖。这个“中国智能科技最高奖”背后,是团队近20年的持续深耕。

“机器学习,就是利用算法从数据中自动归纳规律,并利用这些规律对未知数据进行预测或决策。”谈及获奖项目,耿新介绍,以机器学习中的核心分支——监督学习为例,传统监督学习在面对一个复杂对象时,往往只能给出简单的“是或否”的判断,“比如,一幅图像里有猫、狗、大树等多个元素,传统的标注会告诉我们‘有猫、有狗、有树’,但它不会告诉我们,不同元素在画面里占多少比重,‘显著程度’分别有多高,这可能导致机器在面对真实世界的复杂场景时,理解出现偏差。”

面对这一痛点,耿新教授团队创新提出标记分布学习的理念,其雏形最早可追溯到2007年。经过近10年的积累与打磨,团队终于在2016年将一个完整范式推向学界。该范式的核心突破在于:不仅是给图像打上标签,还要为每一个标签赋予“描述度”。这相当于让AI完成一次认知升维:从判断图像里“有什么”,进阶到理解每个元素“有多少”,从而对复杂对象进行更细腻、更精确的刻画。

“提出想法还不够,想要让它立得住,还得建立基础理论、开发相应算法、推进应用落地……从理论到应用都得走通。”耿新回忆,“最难的就是构建基础理论这一块。比如一个核心点叫‘标记增强机制’。现实中,大家为了节省标注成本,往往只标一个简单的逻辑标记,并没有给出描述度信息。我们要做的,就是通过数据分析,把这些缺失的描述度给恢复出来。”为了保证恢复出来的效果是可靠的,团队耗费3年多构建完整的理论框架;而另一个核心点“标记分布泛化理论”,团队同样打磨近3年。

作为机器学习领域的一个新兴研究方向,标记分布学习吸引了大量国际同行跟研,其中包括哈佛、斯坦福、耶鲁、牛津、剑桥等世界顶尖大学。

自2018年起,美国宇航局(NASA)在“好奇号”火星车的矿物分析任务中,就采用了标记分布学习作为核心算法。团队成员、东南大学计算机学院副教授徐宁介绍,火星矿物的化学成分非常复杂,以前的统计方法很难预测超过3种元素的化学成分。该算法通过分析矿物晶体的X射线衍射数据,能精准预测多种化学元素及其丰度,帮助科学家还原火星地质历史。

此外,标记分布学习还被应用于集成电路领域,支撑构建芯片设计大模型,助力芯片设计自主化。目前,团队正在将这一技术应用于大模型的“安全对齐”研究。“大模型生成的内容,有时候可能不安全,或者跟人类的价值观有冲突。”徐宁透露,如何让大模型与人类的价值观“对齐”,使其更符合人类预期,恰好是标记分布学习未来可以发挥作用的方向。