智能体工程发展史

概述

智能体工程(Agentic Engineering) 是一种用 AI 编程工具写代码的工程实践。人类负责定义目标和验收标准,AI 编程工具负责生成代码,人类负责审核和决策。

2026 年 2 月,Andrej Karpathy 正式提出这一术语,标志着 AI 辅助编程从"氛围编程"演进为有结构化工程实践的学科。


一、起源:人类打字,AI 补全

1.1 早期 AI 辅助编程(2019-2021)

AI 辅助编程最早的形式是代码补全

  • 2019 年:GitHub Copilot 推出,使用 OpenAI Codex 提供代码补全
  • 人类写注释,AI 补全代码
  • AI 每次生成一小段代码(几行到几十行)
  • 人类负责打字,AI 负责补全
// 人类写注释
// 计算斐波那契数列

// AI 补全
function fib(n) {
    if (n <= 1) return n;
    return fib(n - 1) + fib(n - 2);
}

特点:

  • AI 是助手,人类是主体
  • 每次交互很短
  • 人类仍然在"打字"

1.2 AI 助手的进化(2021-2022)

随着 GPT-3.5/GPT-4 的出现,AI 助手变得更加智能:

  • 2022 年:ChatGPT 发布,AI 对话成为主流交互方式
  • 人类开始用自然语言描述需求,AI 生成代码
  • 每次交互从"几行"扩展到"整个文件"
  • 但仍然是人描述,AI 生成
// 人类:帮我写一个用户登录的 API
// AI:生成完整的登录 API 代码

二、Vibe Coding 的诞生(2025)

2.1 2025 年 2 月:Karpathy 创造 "Vibe Coding"

2025 年 2 月 3 日,Andrej Karpathy 宣布:

"I just invented a new term: vibe coding"

定义:

"Vibe coding is where you just tell the AI what you want, and it writes the code. You trust it works. You don't review it. You just vibe."

核心特征:

  • 描述需求,AI 生成代码
  • 不验证,不审查
  • "只要能用就行"

2.2 Vibe Coding 的流行

Vibe coding 迅速流行,因为它:

  • 门槛低:任何人都能用
  • 速度快:几秒生成完整功能
  • 感觉好:不用写代码,AI 全包

但问题也很明显:

  • 生成的代码质量参差不齐
  • 没有测试,没有审查
  • 上线后 Bug 频出
  • 技术债务快速积累

2.3 Vibe Coding 的典型流程

人类:build a user login API
AI:✅ 生成代码(30秒)
人类:looks good, ship it 🚀
(上线后:500错误)

三、问题的暴露(2025)

3.1 Vibe Coding 的代价

2025 年中,许多团队开始承受 vibe coding 的代价:

问题 描述
代码质量差 AI 生成的代码没有测试,没有审查,上线后 Bug 不断
技术债务 代码不可维护,没有人真正理解逻辑
安全漏洞 SQL注入、XSS、敏感信息泄露频发
调试困难 AI 生成的代码难以理解,出了问题找不到原因
团队退化 工程师不再写代码,也不再理解代码

3.2 行业的反思

2025 年下半年,开发者社区开始反思:

"We were so excited to let AI write code, we forgot to check if it was correct."

关键洞察:

  • AI 生成的代码不是免检品
  • 速度不等于质量
  • "能用就行"的心态迟早会出问题

四、Spec-Driven 的回归(2025-2026)

4.1 行业的觉醒

2025 年底,开发者社区开始回归基本工程实践:

核心认知:

  • 代码必须符合规范
  • AI 生成代码也需要审查
  • 没有规范的开发就像没有设计图就施工

4.2 Spec-Driven 的具体实践

旧流程(vibe coding):
  想法 → AI 生成代码 → 上线

新流程(spec-driven):
  想法 → 写 SPEC → AI 生成代码 → 审核 → 测试 → 上线

Spec 的内容:

  • 功能需求
  • 验收标准
  • 技术约束
  • 边界情况

4.3 为什么 Spec 重要

没有 Spec 有 Spec
AI 自由发挥,输出不确定 明确目标,输出可预期
无法验证是否完成 验收标准清晰
边界情况没考虑 边界情况已定义
代码质量参差不齐 质量有保证

五、Agentic Engineering 的诞生(2026)

5.1 2026 年 2 月:Karpathy 提出新术语

2026 年 2 月 4 日,Karpathy 宣布:

"I just invented a new term: agentic engineering"

定义:

"'agentic' because the new default is you're not writing the code directly 99% of the time, you're orchestrating agents who do and acting as oversight. 'Engineering' to emphasize that there is an art & science and expertise to it."

核心变化:

Vibe Coding Agentic Engineering
AI 生成,人不审 AI 生成,人审核
速度优先 质量优先
"能用就行" "生产级"
随意 prompt 结构化方法
人类是观众 人类是架构师

5.2 Agentic Engineering 的核心公式

Agentic Engineering = Human defines goals + AI generates code + Human reviews

不是:

  • 不是构建 AI 智能体系统
  • 不是多智能体编排
  • 不是纯 prompt 工程

是:

  • 用 AI 工具写代码的工程实践
  • Spec-driven + AI 执行 + Human oversight
  • 从"打字员"到"架构师/审核者"的转变

5.3 Agentic Engineering 的实践

1. 写 SPEC(规范)
   ↓
2. AI 生成代码
   ↓
3. 人类审核
   ↓
4. 不通过?→ AI 修复 → 重新审核
   ↓
5. 通过 → 写测试 → 合并

六、关键人物与贡献

6.1 Andrej Karpathy

  • 2025 年 2 月:创造 "vibe coding" 一词
  • 2026 年 2 月:创造 "agentic engineering" 一词
  • 推动 AI 辅助编程从随意走向工程化

6.2 社区的教训

2025 年的教训:

  • AI 生成的代码不是免检品
  • 速度不等于质量
  • 没有规范的开发迟早会出问题

2026 年的行动:

  • 写 SPEC 再开发
  • AI 代码必须审核
  • 测试覆盖不能少
  • 技术债务要控制

七、现状与展望

7.1 当前状态(2026 年中)

Agentic Engineering 正在成为主流:

指标 2025 年初 2026 年中
使用 AI 写代码的开发者 ~30% ~70%
写 SPEC 的团队 ~10% ~40%
有代码审查流程的团队 ~20% ~50%

7.2 核心区别总结

Vibe Coding Agentic Engineering
核心理念 信任 AI 验证 AI
人类角色 观众 架构师/审核者
代码审查 跳过 必须
测试 忽略 关键
质量标准 "能用就行" "生产级可维护"
典型心态 "反正 AI 写的" "AI 写的也要验证"

八、实践指南

8.1 最小可行流程

# Agentic Engineering 流程
def code_with_ai():
    spec = write_spec()        # 1. 写规范
    code = ai_generate(spec)   # 2. AI 生成
    review(code, spec)         # 3. 人类审核
    test(code, spec)           # 4. 测试
    ship()                     # 5. 发布

8.2 SPEC 模板

# 功能名称

## 需求
- 描述要做什么

## 验收标准
- [ ] 标准 1
- [ ] 标准 2

## 技术约束
- 技术要求

## 边界情况
- 边界 1
- 边界 2

8.3 代码审查清单

  • 代码是否符合 SPEC?
  • 有测试覆盖吗?
  • 变量命名清晰吗?
  • 有安全漏洞吗?
  • 错误处理完整吗?

8.4 渐进式采用

阶段 1:修复 bug 时用 AI
  → AI 生成修复 → 审核 → 合并

阶段 2:新功能开发
  → 写 SPEC → AI 生成 → 审核 → 测试 → 合并

阶段 3:完整模块
  → 完整 SPEC → 多文件 → 集成测试

阶段 4:项目级
  → 架构规范 → 团队协作 → 全流程覆盖

九、总结

智能体工程的演进:

阶段 时间 核心特征
代码补全 2019-2021 AI 补全几行代码
AI 助手 2021-2022 自然语言描述,AI 生成代码
Vibe Coding 2025 描述即代码,不审查
Spec-Driven 2025-2026 先写规范再开发
Agentic Engineering 2026+ Human defines goals + AI generates + Human reviews

核心认知:

  • AI 是工具,不是替代者
  • 人类仍然负责质量
  • 工程实践没有过时

下一步:

  • 写规范
  • 验证输出
  • 保持人类在环

参考来源