电子报阅读机
2026-03-27
星期五
当前报纸名称:宝安日报

健忘与过拟合

日期:11-09
字号:
版面:第A12版:伶仃洋·专栏       上一篇    下一篇

罗慧怡

我不懂AI,但很喜欢看行业内的访谈,想从中窥探未来,也想瞥见一些对人类智能的洞见。是的,通过理解人工智能来理解人类智能,一种图灵测试逻辑的倒置版。

OpenAI联合创始人、AI领域教育者Andrej Karpathy最近在接受Dwarkesh Patel访谈时提出的洞见,意外地为我提供了一个全新的视角,来看待我对人类智能一直以来的几个困惑:随着理解能力的增强,我的记忆力好像变差了(25岁之前);25岁以后,记忆力与理解新事物的能力双双下降,我好像有了点中年人的无趣,甚至要靠和年轻人交谈、玩耍来“吸食”活力;虽然还没步入老年,但能明显感觉到,不少老年人总是在重复那几个故事……这些困惑可以总结成一个问题,人,或者说一个系统(AI)是如何失去活力、适应性和智能的。

访谈中提到了一个关键概念,“过拟合”,指机器学习模型在训练数据上表现极佳,但对新的、未见过的数据预测效果差的现象。对AI而言,这是由于模型对训练数据(互联网文本)的记忆力过强,它学会了逐字背诵维基百科,而不是去理解文字背后的通用规则和抽象模式。

还有一个关键概念是AI领域的“模型坍缩”。简单来说,当一个AI不断“吃自己的尾巴”——即用它自己生成的数据来训练自己时,它并不会变得更聪明。相反,它的输出会“悄悄地坍缩”,失去多样性。一个例子是:你现在让AI讲个笑话,它翻来覆去可能只会讲那三个。

Karpathy的逻辑是,LLM(AI)由于拥有超强记忆力,导致过拟合,其输出的内容将高度可预测、单一,且缺乏多样性,最终系统在自我投喂中失去了产生新事物的能力,加速僵化,最终导向坍缩。

这是一个技术问题,以我们如今看到的AI奇迹,我相信辅之以无穷的人力(外界输入的新数据)和行业的信心(约等于钱),技术问题总能解决。

由此引出的类比让我觉得更有意思:人类,是否也会随着时间而坍缩?

Karpathy认为,会的。

和AI一样,我们也会过拟合。随着年龄增长和经验固化,我们倾向于反复思考同样的事情,说同样的话,学习能力下降,认知逐渐僵化,无法像儿童一样用全新的视角看问题。是的,孩子们尚未过拟合,他们会说出令人震惊的话,他们还没有坍缩——不难理解,很多人应对中年危机的方式是,生个孩子。

这种过拟合如此普遍,以至于大脑甚至可能进化出了一种对抗机制。访谈中提到,有科学假说认为,做梦就是一种对抗方式——在梦里用荒诞的、毫无逻辑的“噪音”来冲击白天的认知,防止我们的思维模型变得僵化。

颠覆认知的是,“不善于记忆”这件事,可能只是一个(儿童的)特性,而不是一个缺陷。因为当大脑无法记住所有细节,无法过拟合,它被迫去寻找事物背后的通用规律,去“见林不见树”。相反,LLM(AI)那超强的、逐字背诵的记忆力,反而分散了它们的注意力,让它沉迷于细节,而忽视了整片森林。

在这个试图优化一切的时代,我们那些未经优化的部分,我们的健忘、我们的笨拙、我们梦境、我们生活中的噪音,并不是智能的缺陷,而是我们得以对抗坍缩、保持活力的特性。

真正的学习很痛苦,成年人会做很多琐事来逃避它。希望自己可以拥有孩子般的好奇心,勇敢地张望全新的世界,始终为摒弃旧的思维结构、拥抱新的经验保留可能性。