Claude Code 太费 token?OpenWolf 想省这一笔

Claude Code 用起来顺,但它有一个很现实的问题:它不知道项目里每个文件大概是什么,除非先打开来看。

项目小的时候,这不算麻烦。项目一大,它就容易反复读文件、重复扫目录、忘记前面踩过的坑。人看着像是在“认真理解项目”,但 token 和时间都在一点点流走。

cytostack/openwolf 想补的就是这一块。它不是新的聊天窗口,也不是 Claude Code 的替代品,而是给 Claude Code 加一层项目记忆。

OpenWolf 项目地图与记忆示意图

它想解决什么

OpenWolf 在 README 里把自己叫做 “A second brain for Claude Code”。这个说法有点大,但方向很清楚:让 Claude Code 在读文件之前,先知道项目里有什么。

它会在项目里创建一个 .wolf/ 目录,里面包括项目地图、学习记忆、操作日志、bug 记录、token 账本和 hook 脚本。

这些文件不是给人看的花架子,而是给 Claude Code 提供上下文。

比如 anatomy.md 记录文件说明和大致 token 估算。Claude 要读某个文件前,可以先知道这个文件大概负责什么、体量有多大。cerebrum.md 记录用户偏好、纠正和不要重复犯的错误。token-ledger.json 则记录读写行为和 token 估算。

简单说,它在 Claude Code 旁边放了一本项目手册。

有意思的是 hook

OpenWolf 的实现方式不是接管 Claude,而是用 6 个 hook 脚本插进 Claude Code 生命周期。

Claude 读文件前,OpenWolf 会提示这个文件的描述和 token 估算;如果本轮会话已经读过,它会提醒重复读取。Claude 写代码前,它会检查 cerebrum.md 里有没有相关的历史纠正。写完之后,它再更新项目地图、追加记忆、记录 token。

这个设计比较克制。

它没有让用户换一个新工具,也没有要求改变工作流。照常运行 claude,OpenWolf 在后面维护一套项目状态。

这类工具真正有用的地方,往往不是“让模型更聪明”,而是减少模型重复做笨事。

token 账本值得看

README 里给了一组使用数据:在一个大型活跃项目上,OpenWolf + Claude CLI 的 token 消耗约 425K,而裸 Claude CLI 约 2.5M。作者还提到跨 20 个项目、132+ 次会话的平均 token 降低是 65.8%,重复读文件拦截比例为 71%。

这些数字只能当项目方经验看,不能直接当成通用结论。不同项目结构、提示词习惯、任务类型都会影响结果。

但 token 账本这个方向本身是对的。

很多时候 AI 编程工具消耗大,不是因为它生成了多少代码,而是因为它在反复找上下文。项目地图和重复读取提醒如果能稳定工作,确实有机会把浪费压下来。

怎么开始

安装方式很直接:

1
2
3
npm install -g openwolf
cd your-project
openwolf init

初始化后,项目里会出现 .wolf/ 目录。之后继续正常使用 Claude Code。

它提供的命令也比较偏维护型,比如:

  • openwolf status 查看健康状态和统计。
  • openwolf scan 刷新项目结构地图。
  • openwolf dashboard 打开实时面板。
  • openwolf bug search <term> 搜索历史 bug 记忆。
  • openwolf restore [backup] 从备份恢复 .wolf/

如果只是试用,不建议一开始就在核心生产项目里全量接入。更稳的方式是拿一个中等规模项目跑几天,看它是否真的减少重复读文件,再决定要不要长期用。

适合什么场景

OpenWolf 更适合长期用 Claude Code 维护项目的人。

如果只是让 Claude 改一个小脚本,额外维护 .wolf/ 意义不大。但如果项目文件多、上下文长、经常跨会话修改,项目地图和记忆就有价值。

它尤其适合几类情况:

  • 老项目结构复杂,找文件成本高。
  • Claude 经常重复读同一批文件。
  • 团队或个人有固定代码偏好,希望 Claude 不要反复踩同一个坑。
  • 想知道一次会话里 token 大概花到哪里了。

这里的重点不是“自动化更强”,而是“少浪费上下文”。

需要保留的谨慎

OpenWolf 也有边界。

README 里写得比较坦白:Claude Code hooks 还是相对新的能力,hook 不触发时会回退到 CLAUDE.md 指令;token 统计是估算,不是 API 精确计费;cerebrum.md 依赖 Claude 按指令更新,遵循率不是 100%。

这些限制很重要。因为 OpenWolf 解决的是“上下文治理”,而不是直接替你写代码。它能不能长期有用,取决于项目地图是否及时、记忆是否干净、hook 是否稳定。

如果 .wolf/ 里的信息变旧,反而可能给 Claude 错误提示。

所以试用时最该看的不是首日效果,而是一周后它有没有保持准确。

这类工具会越来越多

OpenWolf 和前面写过的 CodeGraph 代码地图 有点像,都在解决同一件事:AI 编程工具不能每次都像第一次进项目一样乱翻文件。

区别在于 CodeGraph 更像结构化代码图谱,OpenWolf 更像 Claude Code 的项目记忆和行为账本。

这个方向值得继续观察。模型能力提升很重要,但上下文拿得准不准,同样决定 AI 编程体验。真正省心的工具,不一定是再多一个模型,而是让模型少走弯路。

OpenWolf 做的,就是把这条弯路提前标出来。

项目地址:https://github.com/cytostack/openwolf