健忘与过拟合

日期：11-09

字号：大 中 小

版面：第A12版：伶仃洋·专栏上一篇 下一篇

罗慧怡

我不懂AI，但很喜欢看行业内的访谈，想从中窥探未来，也想瞥见一些对人类智能的洞见。是的，通过理解人工智能来理解人类智能，一种图灵测试逻辑的倒置版。

OpenAI联合创始人、AI领域教育者Andrej Karpathy最近在接受Dwarkesh Patel访谈时提出的洞见，意外地为我提供了一个全新的视角，来看待我对人类智能一直以来的几个困惑：随着理解能力的增强，我的记忆力好像变差了（25岁之前）；25岁以后，记忆力与理解新事物的能力双双下降，我好像有了点中年人的无趣，甚至要靠和年轻人交谈、玩耍来“吸食”活力；虽然还没步入老年，但能明显感觉到，不少老年人总是在重复那几个故事……这些困惑可以总结成一个问题，人，或者说一个系统（AI）是如何失去活力、适应性和智能的。

访谈中提到了一个关键概念，“过拟合”，指机器学习模型在训练数据上表现极佳，但对新的、未见过的数据预测效果差的现象。对AI而言，这是由于模型对训练数据（互联网文本）的记忆力过强，它学会了逐字背诵维基百科，而不是去理解文字背后的通用规则和抽象模式。

还有一个关键概念是AI领域的“模型坍缩”。简单来说，当一个AI不断“吃自己的尾巴”——即用它自己生成的数据来训练自己时，它并不会变得更聪明。相反，它的输出会“悄悄地坍缩”，失去多样性。一个例子是：你现在让AI讲个笑话，它翻来覆去可能只会讲那三个。

Karpathy的逻辑是，LLM（AI）由于拥有超强记忆力，导致过拟合，其输出的内容将高度可预测、单一，且缺乏多样性，最终系统在自我投喂中失去了产生新事物的能力，加速僵化，最终导向坍缩。

这是一个技术问题，以我们如今看到的AI奇迹，我相信辅之以无穷的人力（外界输入的新数据）和行业的信心（约等于钱），技术问题总能解决。

由此引出的类比让我觉得更有意思：人类，是否也会随着时间而坍缩？

Karpathy认为，会的。

和AI一样，我们也会过拟合。随着年龄增长和经验固化，我们倾向于反复思考同样的事情，说同样的话，学习能力下降，认知逐渐僵化，无法像儿童一样用全新的视角看问题。是的，孩子们尚未过拟合，他们会说出令人震惊的话，他们还没有坍缩——不难理解，很多人应对中年危机的方式是，生个孩子。

这种过拟合如此普遍，以至于大脑甚至可能进化出了一种对抗机制。访谈中提到，有科学假说认为，做梦就是一种对抗方式——在梦里用荒诞的、毫无逻辑的“噪音”来冲击白天的认知，防止我们的思维模型变得僵化。

颠覆认知的是，“不善于记忆”这件事，可能只是一个（儿童的）特性，而不是一个缺陷。因为当大脑无法记住所有细节，无法过拟合，它被迫去寻找事物背后的通用规律，去“见林不见树”。相反，LLM（AI）那超强的、逐字背诵的记忆力，反而分散了它们的注意力，让它沉迷于细节，而忽视了整片森林。

在这个试图优化一切的时代，我们那些未经优化的部分，我们的健忘、我们的笨拙、我们梦境、我们生活中的噪音，并不是智能的缺陷，而是我们得以对抗坍缩、保持活力的特性。

真正的学习很痛苦，成年人会做很多琐事来逃避它。希望自己可以拥有孩子般的好奇心，勇敢地张望全新的世界，始终为摒弃旧的思维结构、拥抱新的经验保留可能性。

健忘与过拟合

日期：11-09 字号：大中小 版面：第A12版：伶仃洋·专栏 上一篇 下一篇

日期：11-09

字号：大中小

版面：第A12版：伶仃洋·专栏上一篇下一篇