终端里的 AI 编程工具:我把四款主力 CLI 都用了一遍,说说谁适合什么场景

上周在咖啡厅写代码,旁边一个哥们看我盯着黑乎乎的终端窗口敲命令,凑过来看了一眼,问我是不是在搞什么黑客操作。

我说不是,我在让 AI 帮我改代码。

他愣了一下。他以为 AI 编程工具都是那种 IDE 里飘着彩色补全框的东西,没想过终端里也能跑 AI。

其实半年前我也是这么想的。直到有一次我在服务器上改配置文件,没有 IDE,没有 GUI,只有一个 SSH 连接和一块终端屏幕。那时候我才发现,终端里的 AI 编程工具,已经不是玩具了。

过去两周我把四款主流终端 AI 编程工具都跑了一遍——Claude Code、Codex CLI、Gemini CLI、Aider。有些惊喜,有些踩坑,有些让我重新思考了”在终端里写代码”这件事。

先说结论,怕你们没耐心

不是每个人都需要终端 AI 工具。如果你日常用 Cursor 或者 VS Code + Copilot,代码补全、内联建议、Agent 面板,这些都已经够用了。

但如果你遇到过这些场景:SSH 到远端服务器改代码、在 Docker 容器里调试、CI/CD 脚本需要 AI 帮忙写、或者就是单纯觉得 IDE 太重了想轻装上阵——那终端 AI 工具确实能解决实际问题。

四款工具里,我的结论是:

  • 预算充足、任务复杂→ Claude Code,没别的选择,自主性最强
  • 追求速度、日常小改→ Codex CLI,响应快,Rust 写的体感就是不一样
  • 零预算、大型仓库→ Gemini CLI,1M 上下文 + 完全免费,这个组合太狠了
  • 在意可控性、想换模型→ Aider,git-first 设计,每次改动都有 commit

Claude Code:让 AI 自己干四十分钟

我第一次用 Claude Code 的时候有点不习惯。

大部分 AI 编程工具是”你说一句它做一步”,像是在指挥一个实习生。Claude Code 不一样,你给它一个任务,比如”把这个模块从 REST 迁移到 GraphQL”,然后你就可以去泡咖啡了。

它会自己读代码、规划步骤、写代码、跑测试、发现问题、再改。四十分钟后你回来看,可能已经完成了,也可能在某个步骤卡住了,但不管怎样,它确实在”自主工作”。

这种体验挺奇妙的。有点像你交给同事一个任务,他不是每一步都来问你,而是自己想办法。

Claude Code 背后跑的是 Anthropic 的 Opus 4.7 模型,SWE-bench 得分 80% 以上。实际用下来,跨文件重构和复杂 bug 修复确实是它的强项。它能在几十个文件之间理解依赖关系,然后有针对性地修改。

不过有个坑要注意:Claude Code 订阅版的上下文窗口是 200K token,不是很多人以为的 100 万。100 万只有通过 API 调用才能用。如果你的仓库超过 5 万行代码,可能需要手动指定让 AI 关注哪些目录。

价格方面,Pro 版 $20/月够日常用(大约每天 2-3 小时中等强度),重度开发者需要 Max 5x($100/月)或 Max 20x($200/月)。

Codex CLI:快到让你以为是假的

Codex CLI 是 OpenAI 用 Rust 写的终端工具。对,Rust。这就是它快的原因。

体感上,同样的提问,Codex CLI 比 Claude Code 快 30% 到 50%。这个差距在日常问答里不明显,但你一天问几百个问题,累计起来就很可观了。

Codex CLI 的定位是”快速反馈”,适合小改动、代码审查、格式化这类短平快的任务。默认开了沙箱执行,AI 生成的代码不会直接改你的文件,而是先在沙箱里跑,确认没问题再应用。安全性好,但如果你想让 AI 做一系列连续修改,每一步都要确认,会有点烦。

我平时用 Codex CLI 做的事情:快速查一个 API 用法、让 AI 解释一段看不懂的代码、写个一次性脚本、或者给 PR 写 review 意见。这些任务不需要 AI 深度理解整个项目,快就够了。

定价和 Claude Code 类似,$20/月的 ChatGPT Plus 包含一定额度。如果你已经有 ChatGPT Plus,等于白嫖。

Gemini CLI:免费的就一定差吗?

说实话,我一开始没把 Gemini CLI 当回事。免费的东西嘛,能用就行,不指望多好。

然后我发现它每天给 1000 次调用,上下文窗口 1M token——比 Claude Code 订阅版大五倍。

这个规格放在付费工具里都算顶配了,Google 直接白送。

Gemini CLI 背后跑的是 Gemini 2.5 Pro Flash,不是最强的 3 Pro,但 Flash 的速度更快,日常编程完全够用。它还有个杀手级功能:原生支持 Google Search grounding。你在问它某个 API 怎么用的时候,它可以实时搜索最新文档,然后基于文档回答。这对那些刚发布、文档还没被训练数据覆盖的新框架特别有用。

当然,免费的也有代价。Gemini CLI 是单 Agent 架构,不支持并行子任务。深度推理能力弱于 Claude Opus。而且有时候 Google Search 会把一些过时的 StackOverflow 答案混进来,反而误导你。

我现在的用法是:Gemini CLI 当”搜索引擎 + 轻量助手”,Claude Code 当”主力工程师”。两者互补。

Aider:每次改动都有退路

Aider 是四款工具里最”程序员思维”的。

它的设计理念是 git-first:AI 每做一次修改,自动创建一个 git commit。这意味着你可以随时回滚任何一次 AI 的修改,精确到每一步。

这个设计解决了 AI 编程的一个核心痛点:AI 改了十个文件,其中八个改对了,两个改坏了,你怎么回滚?在别的工具里,你只能手动撤销或者重新来。在 Aider 里,直接 git revert 那两个文件的 commit 就行。

Aider 还有个特点:模型无关。你可以让它跑 Claude、GPT、Gemini,甚至本地部署的 Llama。切换模型就一行命令的事。工具本身免费,成本就是 API 调用费。用 Gemini API 的话,一个月可能也就几块钱。

不过 Aider 的自主性比较弱。它更像一个”结对编程伙伴”而不是”自主工程师”。你给它的指令越具体,它做得越好。如果你希望”放手让 AI 干完整个任务”,Aider 不太合适。

我一般在两种场景下用 Aider:一种是需要精确控制每次修改的情况(比如改生产环境的配置),另一种是网络不稳定的环境(Aider 的断点恢复机制做得很好,因为它有每一步的 git commit)。

我的实际工作流

说了这么多,我日常到底怎么用这些工具?

大部分时间我还是坐在 IDE 里写代码,用 Cursor 或者 GitHub Copilot 做代码补全。终端 AI 工具不是用来替代 IDE 的,而是补充 IDE 覆盖不到的场景。

我的组合方案是这样的:

早上打开 Claude Code,给它布置今天的第一个复杂任务——比如重构某个模块、或者写一个新的 API 端点。趁它自己跑的时候,我打开 IDE 处理别的事情。

遇到需要查文档或者问快速问题的时候,切到 Gemini CLI,速度快还免费,省得浪费 Claude Code 的额度。

小改动、写测试、改配置文件这些零碎活,用 Codex CLI,响应快,几秒钟搞定。

如果要改生产环境的代码,或者对修改粒度要求很高,用 Aider,每一步都有 git commit 保底。

这四款工具不是竞争关系,更像是不同的工具箱。你不会用一把螺丝刀拧所有的螺丝,AI 编程工具也一样。

之前写过一篇 GitHub Copilot 深度使用指南,聊的是 IDE 内的 AI 工具。这篇算是它的姊妹篇——当你的手离开鼠标、放到键盘上的时候,终端里其实有另一套完整的 AI 编程体系在等你。

如果你还没试过终端 AI 编程,建议从 Gemini CLI 开始,反正免费,装上玩半小时就有感觉了。

已经在用终端 AI 工具的,可以告诉我你用的是哪个,以及你最受不了它什么。我最近在考虑要不要写一篇”Aider 高级用法”,把 architect 模式和模型切换的技巧展开聊聊。


终端里的 AI 编程工具:我把四款主力 CLI 都用了一遍,说说谁适合什么场景
https://www.ohtudou.top/2026/04/19/2026-04-19-terminal-ai-coding-tools-guide/
作者
Tudo
发布于
2026年4月19日
许可协议