AI 编程助手,我从「偶尔补全」到「全天候 Agent」的实战路线图
用了一年多 AI 编程工具,结论一句话:真正的效率飞升不在补全,而在把 AI 当成能操控终端的 Agent 来用。
背景:团队从 GitHub Copilot 切换到 Claude Code,我发现大多数人只用到了 20% 的能力。
问题是什么
2024 年我开始重度使用 AI 编程助手,遇到一个尴尬的局面:
补全很爽,但遇到稍微复杂一点的任务就断片。
比如重构一个跨模块的 API 变更、写一套完整的 CRUD 接口加测试、排查一个需要 grep 五六个文件的 Bug——这些事我还是要自己动手,AI 帮不上什么忙。
用 Copilot 时,流程是这样的:写注释 → 等补全 → 手工调整。一天下来看统计数据,可能节省了 20% 的 typing 时间,但那 80% 的思考和操作时间一点没省。
后来换到 Claude Code(一个终端里的 Agent 模式编程助手),花了 3 周才真正摸透怎么用它干「正经活」。这篇文章就是那 3 周的浓缩记录。
解决思路
我按能力分级来看这件事:
| 层级 | 能力 | 典型工具 | 节省时间 |
|---|---|---|---|
| L1 | 代码补全 | Copilot / Supermaven | ~20% |
| L2 | 对话式编程 | ChatGPT / Claude.ai | ~40% |
| L3 | 终端内 Agent | Claude Code / Cursor Agent | ~70% |
| L4 | 全自动流水线 | Agent + CI + Cron | ~90%(需要设置) |
我的判断:大部分用户停在 L1-L2,而真正值得投入的是 L3。 不是工具本身多玄乎,是工作流要变。
操作步骤
下面是我现在每天实际使用的四个步骤,按能力递进。
步骤 1:理解项目结构——别让 AI 盲人摸象
我一开始也让 AI 直接写代码,但 Agent 不知道项目长什么样。第一步是给它地图。
每个项目根目录下放一个 .claude/CLAUDE.md,开头几行写清楚:
# CLAUDE.md - 项目指南
## 技术栈
- Python 3.12 + FastAPI
- PostgreSQL 15 + SQLAlchemy 2.0
- 前端: Vue 3 + Vite
## 目录结构
src/api/ — API 路由
src/models/ — 数据库模型
src/services/ — 业务逻辑
tests/ — 测试文件 (pytest)
## 关键约定
- 所有 API 返回统一格式: {code, data, message}
- 数据库迁移用 Alembic
- 测试覆盖率不低于 80%
有了这个文件,Agent 每次启动就知道上下文。我不写废话,只写 Agent 需要知道的事实。
注意: CLAUDE.md 不是 README,是给 AI 读的。技术栈、目录约定、命名规范比「项目简介」重要得多。
步骤 2:把任务「拆分」而不是「描述」
我以前的做法:「帮我写一个用户管理系统。」
现在我会把任务拆成可验证的原子步骤。用 /loop 技能或者直接分步写:
1. 在 src/models/user.py 创建 User 模型,包含 id, name, email, created_at 字段
2. 在 src/api/users.py 创建 POST /users 和 GET /users/{id} 两个端点
3. 在 tests/test_users.py 写这两个端点的测试
4. 运行 pytest tests/test_users.py -v 确认全部通过
每个步骤都是一个 Agent 能独立完成、我能独立验证的小单元。卡在第二步就只修第二步,不影响其他。
实操经验:一个任务分到 5 步左右最优。超过 8 步说明拆分颗粒度太大,少于 3 步说明还没想清楚。
步骤 3:用 Terminal Agent 替代 Ctrl+C/V
这是我从 L2 跳到 L3 的关键一步——不再把 AI 当聊天框,而是当队友,让它自己跑命令。
比如排查一个测试失败:
# 传统做法:复制错误信息 → 粘贴到 ChatGPT → 看建议 → 手动修改
# Agent 做法:直接给 Agent 错误信息,让它自己查
我现在的流程是:
> 帮我修一下 test_user_create 这个测试失败
# Agent 会自己:
# 1. pytest tests/test_user_create.py -v 看具体错误
# 2. grep 相关的源码和测试文件
# 3. 定位问题 → 修改代码
# 4. 重新跑测试确认
关键区别:Agent 可以执行命令并读取结果。不需要我手动 copy-paste 错误信息。
这里有个踩坑记录:给 Agent 权限要克制。 一开始给了 --dangerously-skip-permissions,结果 Agent 直接 rm -rf node_modules 重装了一遍(虽然没出事,但吓我一跳)。正确做法是只允许需要的操作:
# 允许:读文件、git diff、npm test
# 不允许:删除操作、生产环境部署
步骤 4:从手搓到自动流水线
我最高频的 Agent 用法写成了一个 shell 脚本,每晚自动运行:
#!/bin/bash
# 日常维护流水线
# 1. 检查待办的 TODO
grep -r "TODO" src/ --include="*.py" | wc -l
# 2. 让 Agent 检查并清理
claude -p "检查 src/ 中所有 TODO,评估哪些可以立即处理,
对每个 TODO 给出处理建议(是现在修、还是可以删掉),
统计总数并分类。" -p "处理所有无需保留的 TODO"
# 3. 检查测试覆盖率
pytest --cov=src --cov-report=term
这套流水线跑了一个月,TODO 从 47 个降到 12 个(大部分是确实需要延期处理的),测试覆盖从 63% 提到 82%。
结果与总结
效果:
踩过的坑:
延伸思考
下一步我在尝试的方向:Agent 多开。
用 Claude Code 开 3 个终端窗口:
还在试,最大问题是 3 个 Agent 互相改同一个文件会冲突。解决思路是严格按文件模块分区,互不交叉。
另外还想试一个:把 Agent 和 git hook 结合——每次 commit 前让 Agent 自动做 code review。目前只敢在 feature branch 上试,还没上 main。

评论已关闭!