智能体工程发展史
概述
智能体工程(Agentic Engineering) 是一种用 AI 编程工具写代码的工程实践。人类负责定义目标和验收标准,AI 编程工具负责生成代码,人类负责审核和决策。
2026 年 2 月,Andrej Karpathy 正式提出这一术语,标志着 AI 辅助编程从"氛围编程"演进为有结构化工程实践的学科。
一、起源:人类打字,AI 补全
1.1 早期 AI 辅助编程(2019-2021)
AI 辅助编程最早的形式是代码补全:
- 2019 年:GitHub Copilot 推出,使用 OpenAI Codex 提供代码补全
- 人类写注释,AI 补全代码
- AI 每次生成一小段代码(几行到几十行)
- 人类负责打字,AI 负责补全
// 人类写注释
// 计算斐波那契数列
// AI 补全
function fib(n) {
if (n <= 1) return n;
return fib(n - 1) + fib(n - 2);
}
特点:
- AI 是助手,人类是主体
- 每次交互很短
- 人类仍然在"打字"
1.2 AI 助手的进化(2021-2022)
随着 GPT-3.5/GPT-4 的出现,AI 助手变得更加智能:
- 2022 年:ChatGPT 发布,AI 对话成为主流交互方式
- 人类开始用自然语言描述需求,AI 生成代码
- 每次交互从"几行"扩展到"整个文件"
- 但仍然是人描述,AI 生成
// 人类:帮我写一个用户登录的 API
// AI:生成完整的登录 API 代码
二、Vibe Coding 的诞生(2025)
2.1 2025 年 2 月:Karpathy 创造 "Vibe Coding"
2025 年 2 月 3 日,Andrej Karpathy 宣布:
"I just invented a new term: vibe coding"
定义:
"Vibe coding is where you just tell the AI what you want, and it writes the code. You trust it works. You don't review it. You just vibe."
核心特征:
- 描述需求,AI 生成代码
- 不验证,不审查
- "只要能用就行"
2.2 Vibe Coding 的流行
Vibe coding 迅速流行,因为它:
- 门槛低:任何人都能用
- 速度快:几秒生成完整功能
- 感觉好:不用写代码,AI 全包
但问题也很明显:
- 生成的代码质量参差不齐
- 没有测试,没有审查
- 上线后 Bug 频出
- 技术债务快速积累
2.3 Vibe Coding 的典型流程
人类:build a user login API
AI:✅ 生成代码(30秒)
人类:looks good, ship it 🚀
(上线后:500错误)
三、问题的暴露(2025)
3.1 Vibe Coding 的代价
2025 年中,许多团队开始承受 vibe coding 的代价:
| 问题 | 描述 |
|---|---|
| 代码质量差 | AI 生成的代码没有测试,没有审查,上线后 Bug 不断 |
| 技术债务 | 代码不可维护,没有人真正理解逻辑 |
| 安全漏洞 | SQL注入、XSS、敏感信息泄露频发 |
| 调试困难 | AI 生成的代码难以理解,出了问题找不到原因 |
| 团队退化 | 工程师不再写代码,也不再理解代码 |
3.2 行业的反思
2025 年下半年,开发者社区开始反思:
"We were so excited to let AI write code, we forgot to check if it was correct."
关键洞察:
- AI 生成的代码不是免检品
- 速度不等于质量
- "能用就行"的心态迟早会出问题
四、Spec-Driven 的回归(2025-2026)
4.1 行业的觉醒
2025 年底,开发者社区开始回归基本工程实践:
核心认知:
- 代码必须符合规范
- AI 生成代码也需要审查
- 没有规范的开发就像没有设计图就施工
4.2 Spec-Driven 的具体实践
旧流程(vibe coding):
想法 → AI 生成代码 → 上线
新流程(spec-driven):
想法 → 写 SPEC → AI 生成代码 → 审核 → 测试 → 上线
Spec 的内容:
- 功能需求
- 验收标准
- 技术约束
- 边界情况
4.3 为什么 Spec 重要
| 没有 Spec | 有 Spec |
|---|---|
| AI 自由发挥,输出不确定 | 明确目标,输出可预期 |
| 无法验证是否完成 | 验收标准清晰 |
| 边界情况没考虑 | 边界情况已定义 |
| 代码质量参差不齐 | 质量有保证 |
五、Agentic Engineering 的诞生(2026)
5.1 2026 年 2 月:Karpathy 提出新术语
2026 年 2 月 4 日,Karpathy 宣布:
"I just invented a new term: agentic engineering"
定义:
"'agentic' because the new default is you're not writing the code directly 99% of the time, you're orchestrating agents who do and acting as oversight. 'Engineering' to emphasize that there is an art & science and expertise to it."
核心变化:
| Vibe Coding | Agentic Engineering |
|---|---|
| AI 生成,人不审 | AI 生成,人审核 |
| 速度优先 | 质量优先 |
| "能用就行" | "生产级" |
| 随意 prompt | 结构化方法 |
| 人类是观众 | 人类是架构师 |
5.2 Agentic Engineering 的核心公式
Agentic Engineering = Human defines goals + AI generates code + Human reviews
不是:
- 不是构建 AI 智能体系统
- 不是多智能体编排
- 不是纯 prompt 工程
是:
- 用 AI 工具写代码的工程实践
- Spec-driven + AI 执行 + Human oversight
- 从"打字员"到"架构师/审核者"的转变
5.3 Agentic Engineering 的实践
1. 写 SPEC(规范)
↓
2. AI 生成代码
↓
3. 人类审核
↓
4. 不通过?→ AI 修复 → 重新审核
↓
5. 通过 → 写测试 → 合并
六、关键人物与贡献
6.1 Andrej Karpathy
- 2025 年 2 月:创造 "vibe coding" 一词
- 2026 年 2 月:创造 "agentic engineering" 一词
- 推动 AI 辅助编程从随意走向工程化
6.2 社区的教训
2025 年的教训:
- AI 生成的代码不是免检品
- 速度不等于质量
- 没有规范的开发迟早会出问题
2026 年的行动:
- 写 SPEC 再开发
- AI 代码必须审核
- 测试覆盖不能少
- 技术债务要控制
七、现状与展望
7.1 当前状态(2026 年中)
Agentic Engineering 正在成为主流:
| 指标 | 2025 年初 | 2026 年中 |
|---|---|---|
| 使用 AI 写代码的开发者 | ~30% | ~70% |
| 写 SPEC 的团队 | ~10% | ~40% |
| 有代码审查流程的团队 | ~20% | ~50% |
7.2 核心区别总结
| Vibe Coding | Agentic Engineering | |
|---|---|---|
| 核心理念 | 信任 AI | 验证 AI |
| 人类角色 | 观众 | 架构师/审核者 |
| 代码审查 | 跳过 | 必须 |
| 测试 | 忽略 | 关键 |
| 质量标准 | "能用就行" | "生产级可维护" |
| 典型心态 | "反正 AI 写的" | "AI 写的也要验证" |
八、实践指南
8.1 最小可行流程
# Agentic Engineering 流程
def code_with_ai():
spec = write_spec() # 1. 写规范
code = ai_generate(spec) # 2. AI 生成
review(code, spec) # 3. 人类审核
test(code, spec) # 4. 测试
ship() # 5. 发布
8.2 SPEC 模板
# 功能名称
## 需求
- 描述要做什么
## 验收标准
- [ ] 标准 1
- [ ] 标准 2
## 技术约束
- 技术要求
## 边界情况
- 边界 1
- 边界 2
8.3 代码审查清单
- 代码是否符合 SPEC?
- 有测试覆盖吗?
- 变量命名清晰吗?
- 有安全漏洞吗?
- 错误处理完整吗?
8.4 渐进式采用
阶段 1:修复 bug 时用 AI
→ AI 生成修复 → 审核 → 合并
阶段 2:新功能开发
→ 写 SPEC → AI 生成 → 审核 → 测试 → 合并
阶段 3:完整模块
→ 完整 SPEC → 多文件 → 集成测试
阶段 4:项目级
→ 架构规范 → 团队协作 → 全流程覆盖
九、总结
智能体工程的演进:
| 阶段 | 时间 | 核心特征 |
|---|---|---|
| 代码补全 | 2019-2021 | AI 补全几行代码 |
| AI 助手 | 2021-2022 | 自然语言描述,AI 生成代码 |
| Vibe Coding | 2025 | 描述即代码,不审查 |
| Spec-Driven | 2025-2026 | 先写规范再开发 |
| Agentic Engineering | 2026+ | Human defines goals + AI generates + Human reviews |
核心认知:
- AI 是工具,不是替代者
- 人类仍然负责质量
- 工程实践没有过时
下一步:
- 写规范
- 验证输出
- 保持人类在环
参考来源
- Karpathy X (2025-02-03): Vibe coding 原文
- Karpathy X (2026-02-04): Agentic engineering 原文
- Observer: "'Vibe Coding' Inventor Andrej Karpathy Has a New Term for A.I. Coding"