AI自进化，真的开始了

如果你也在关注AI能力边界的变化，这里会持续记录前沿模型的真实进展和它们对开发者的实际影响。关注更新

Anthropic 昨天发了一篇长文博客，标题平铺直叙：When AI builds itself。

但里面的数据，每一项都让人没法平静地读完。

截止今年 5 月，Anthropic 代码库里 80% 以上的代码是 Claude 写的。在 Claude Code 发布之前，这个比例还是个位数。工程师每季度的代码产出量是 2021-2025 年的 8 倍。在最难、最模糊的编程任务上，Claude 的成功率在半年里从 26% 跳到了 76%。

Anthropic 把这些数字串成了一条线：AI 在加速 AI 的研发。他们管这叫「递归自我提升」（Recursive Self-Improvement，RSI），并且为此专门成立了一个研究所来跟踪这件事。

一条越来越陡的曲线

Anthropic 造了一个新维度来衡量这件事：「AI 能独立完成的任务时长」。

2024 年 3 月，Claude Opus 3 能做人类约 4 分钟的软件任务。一年后，Claude Sonnet 3.7 做到了 1.5 小时。又过一年，Claude Opus 4.6 能处理 12 小时的任务。最新的 Mythos 内测版本，METR 测试框架测到了上限：至少 16 小时。

翻倍速度从每 7 个月一次，加速到了每 4 个月一次。按这个趋势，2027 年的数字计量单位会从「小时」变成「周」。

这不是某个单一 benchmark 在涨。SWE-bench 从个位数到饱和用了两年。CORE-Bench 从 20% 的论文复现成功率到饱和用了 15 个月。所有难度类型的编程任务上，Claude 的成功曲线方向一致：向上，加速。

不只是写得快

代码量翻 8 倍，最容易想到的反驳是「注水」。但 Anthropic 拿出了两套证据。

第一套是纠正频率。过去一年，工程师中途接管或纠正 Claude 的次数在持续下降，包括在最开放的任务上—那种连答案长什么样都不确定的类型。成功率 76%，六个月前还是 26%。他们举了一个具体例子：一次训练集群崩溃，几十万个训练作业同时挂掉，工程师只给了 Claude 一些文本描述和集群权限。Claude 自己在几千个运行中的作业里逐个排查，最终定位到一个晦涩的调试开关，复现、确认、修复，两小时。正常需要两三天。

第二套是代码审查。Anthropic 现在所有代码提交都会先过一遍 Claude 的自动审查。他们回溯发现，如果这套机制早就在运转，大约三分之一的 claude.ai 线上事故的 bug 在上线前就会被拦下来。这些代码的编写者，是全球最顶尖的 AI 系统工程师。

研究环节也在收窄

Anthropic 有一个惯例测试：每次发新模型时，给 Claude 一段训练小型 AI 的代码，让它优化运行速度。2025 年 5 月，Claude Opus 4 做到了 3 倍加速。2026 年 4 月，Claude Mythos Preview 做到了 52 倍。作为对照，一个熟练的人类研究员需要 4 到 8 小时才能做到 4 倍。

他们还给 Claude 丢了一个开放式 AI 安全研究：弱模型能不能可靠监督强模型？两个人研究员花了一周缩小了 23% 的差距。Claude 用了 800 小时、花了约 18000 美元算力，缩小了 97%。

代码是 Claude 写的。代码 review 是 Claude 做的。实验执行比人类快一个数量级。实验设计，Claude 开始自己来了。

人类现在剩下的比较优势只有一个：研究品味和判断力—决定什么问题值得做，什么结果值得信，什么方向该放弃。

但这个优势能守多久，Anthropic 自己也不确定。

一种可能是，「研究品味」会像 AI 之前不会的其他东西一样，先是做不到，然后突然就做到了。AI 理解幽默、展示心智理论、解语言谜题，都走过同样的曲线。另一种可能是，就算 Claude 永远学不会真正的研究品味，按现在的加速趋势，每个研究员同时能指挥的工作量已经大了好几倍。你不需要 AI 完全替代你思考，它只要把所有「执行」的活全干了，你就只需要做那 5% 的方向选择。

三种可能，两个警告

Anthropic 在博客结尾画了三张图：

停滞。 那些指数曲线其实是 S 曲线。也许研究判断力靠 scale 解不了，需要全新的架构突破。也许瓶颈在能源、芯片、算力的物理供应链上。但即便能力冻结在今天，Project Glasswing 上线头几周就发现了超过一万个高危和严重级别的软件漏洞，遍布全球最关键的系统。这个影响已经够大了。

持续加速，人还握着方向盘。 组织效率指数级提升，100 人的公司做 1 万甚至 10 万人的活。Anthropic 觉得这个场景最可能。但他们也发现了一个有意思的现象—阿姆达尔定律在组织里的体现：Claude 把代码写飞了，代码 review 变成了新瓶颈。各种新想法、新工具、新实验爆炸式涌现，远超组织的消化能力。瓶颈不会消失，只会转移到下一个环节。

完全递归自我提升。 AI 开始自己设计、训练下一代 AI。人类退到监督、验证、审核的位置。这种能力大概率会迁移到其他科学领域，医学、材料、能源全线起飞。但偏离也会在自我迭代中累积，最终完全失控。

OpenAI 也在说同样的话

就在几天前，OpenAI 发了类似的博客：

我们也在当今系统中看到自进化的早期迹象：AI 的发展本身也被 AI 加速。我们预计这将加剧开发商和国家之间的竞争压力，并带来现有机构无法应对的治理挑战。

两家公司同时公开谈 RSI，这不常见。

Anthropic 甚至说，如果存在一个可验证的机制能保证所有前沿实验室都真的停了，他们愿意减速、甚至暂停。但他们也承认，单向暂停没有意义—只会让偷偷继续的人拿到领先身位。

他们承诺在接下来几个月组织政策制定者、研究者、民间社会和 AI 公司的对话，讨论 RSI 和协调机制。

博客读下来的感受很复杂。数据本身不骗人。AI 在加速 AI 的研发，这件事已经不只是推论，而是可以在内部系统里拉出图表的事实。奇点这个词在过去几年被过度消费了，但这次，是造奇点的人自己拿出来说的。

参考链接：

想跟上AI的真实变化？

后面会继续写AI模型的能力边界、工具链变化和行业关键动向。关注后，不会被标题党带偏，只看到经过交叉验证的判断。

关注我看更多文章

技术笔记

#AI #Anthropic #Claude #递归自我提升 #RSI

MoneyPrinterTurbo：让小白也拼出短视频下一篇