AI自进化,真的开始了

如果你也在关注AI能力边界的变化,这里会持续记录前沿模型的真实进展和它们对开发者的实际影响。 关注更新

Anthropic 昨天发了一篇长文博客,标题平铺直叙:When AI builds itself

但里面的数据,每一项都让人没法平静地读完。

截止今年 5 月,Anthropic 代码库里 80% 以上的代码是 Claude 写的。在 Claude Code 发布之前,这个比例还是个位数。工程师每季度的代码产出量是 2021-2025 年的 8 倍。在最难、最模糊的编程任务上,Claude 的成功率在半年里从 26% 跳到了 76%。

Anthropic 把这些数字串成了一条线:AI 在加速 AI 的研发。他们管这叫「递归自我提升」(Recursive Self-Improvement,RSI),并且为此专门成立了一个研究所来跟踪这件事。

一条越来越陡的曲线

Anthropic 造了一个新维度来衡量这件事:「AI 能独立完成的任务时长」。

2024 年 3 月,Claude Opus 3 能做人类约 4 分钟的软件任务。一年后,Claude Sonnet 3.7 做到了 1.5 小时。又过一年,Claude Opus 4.6 能处理 12 小时的任务。最新的 Mythos 内测版本,METR 测试框架测到了上限:至少 16 小时。

翻倍速度从每 7 个月一次,加速到了每 4 个月一次。按这个趋势,2027 年的数字计量单位会从「小时」变成「周」。

这不是某个单一 benchmark 在涨。SWE-bench 从个位数到饱和用了两年。CORE-Bench 从 20% 的论文复现成功率到饱和用了 15 个月。所有难度类型的编程任务上,Claude 的成功曲线方向一致:向上,加速。

不只是写得快

代码量翻 8 倍,最容易想到的反驳是「注水」。但 Anthropic 拿出了两套证据。

第一套是纠正频率。过去一年,工程师中途接管或纠正 Claude 的次数在持续下降,包括在最开放的任务上—那种连答案长什么样都不确定的类型。成功率 76%,六个月前还是 26%。他们举了一个具体例子:一次训练集群崩溃,几十万个训练作业同时挂掉,工程师只给了 Claude 一些文本描述和集群权限。Claude 自己在几千个运行中的作业里逐个排查,最终定位到一个晦涩的调试开关,复现、确认、修复,两小时。正常需要两三天。

第二套是代码审查。Anthropic 现在所有代码提交都会先过一遍 Claude 的自动审查。他们回溯发现,如果这套机制早就在运转,大约三分之一的 claude.ai 线上事故的 bug 在上线前就会被拦下来。这些代码的编写者,是全球最顶尖的 AI 系统工程师。

研究环节也在收窄

Anthropic 有一个惯例测试:每次发新模型时,给 Claude 一段训练小型 AI 的代码,让它优化运行速度。2025 年 5 月,Claude Opus 4 做到了 3 倍加速。2026 年 4 月,Claude Mythos Preview 做到了 52 倍。作为对照,一个熟练的人类研究员需要 4 到 8 小时才能做到 4 倍。

他们还给 Claude 丢了一个开放式 AI 安全研究:弱模型能不能可靠监督强模型?两个人研究员花了一周缩小了 23% 的差距。Claude 用了 800 小时、花了约 18000 美元算力,缩小了 97%。

代码是 Claude 写的。代码 review 是 Claude 做的。实验执行比人类快一个数量级。实验设计,Claude 开始自己来了。

人类现在剩下的比较优势只有一个:研究品味和判断力—决定什么问题值得做,什么结果值得信,什么方向该放弃。

但这个优势能守多久,Anthropic 自己也不确定。

一种可能是,「研究品味」会像 AI 之前不会的其他东西一样,先是做不到,然后突然就做到了。AI 理解幽默、展示心智理论、解语言谜题,都走过同样的曲线。另一种可能是,就算 Claude 永远学不会真正的研究品味,按现在的加速趋势,每个研究员同时能指挥的工作量已经大了好几倍。你不需要 AI 完全替代你思考,它只要把所有「执行」的活全干了,你就只需要做那 5% 的方向选择。

三种可能,两个警告

Anthropic 在博客结尾画了三张图:

停滞。 那些指数曲线其实是 S 曲线。也许研究判断力靠 scale 解不了,需要全新的架构突破。也许瓶颈在能源、芯片、算力的物理供应链上。但即便能力冻结在今天,Project Glasswing 上线头几周就发现了超过一万个高危和严重级别的软件漏洞,遍布全球最关键的系统。这个影响已经够大了。

持续加速,人还握着方向盘。 组织效率指数级提升,100 人的公司做 1 万甚至 10 万人的活。Anthropic 觉得这个场景最可能。但他们也发现了一个有意思的现象—阿姆达尔定律在组织里的体现:Claude 把代码写飞了,代码 review 变成了新瓶颈。各种新想法、新工具、新实验爆炸式涌现,远超组织的消化能力。瓶颈不会消失,只会转移到下一个环节。

完全递归自我提升。 AI 开始自己设计、训练下一代 AI。人类退到监督、验证、审核的位置。这种能力大概率会迁移到其他科学领域,医学、材料、能源全线起飞。但偏离也会在自我迭代中累积,最终完全失控。

OpenAI 也在说同样的话

就在几天前,OpenAI 发了类似的博客:

我们也在当今系统中看到自进化的早期迹象:AI 的发展本身也被 AI 加速。我们预计这将加剧开发商和国家之间的竞争压力,并带来现有机构无法应对的治理挑战。

两家公司同时公开谈 RSI,这不常见。

Anthropic 甚至说,如果存在一个可验证的机制能保证所有前沿实验室都真的停了,他们愿意减速、甚至暂停。但他们也承认,单向暂停没有意义—只会让偷偷继续的人拿到领先身位。

他们承诺在接下来几个月组织政策制定者、研究者、民间社会和 AI 公司的对话,讨论 RSI 和协调机制。

博客读下来的感受很复杂。数据本身不骗人。AI 在加速 AI 的研发,这件事已经不只是推论,而是可以在内部系统里拉出图表的事实。奇点这个词在过去几年被过度消费了,但这次,是造奇点的人自己拿出来说的。


参考链接:


想跟上AI的真实变化?

后面会继续写AI模型的能力边界、工具链变化和行业关键动向。关注后,不会被标题党带偏,只看到经过交叉验证的判断。