用 Claude Code Ultrareview 审查 Vibe Code
概述
Vibe Code 指用 AI 编程工具生成的代码,通常质量参差不齐,需要额外审查。
Claude Code Ultrareview 是 Claude Code 中的云端多智能体代码审查命令,启动一组专业审查智能体在远程沙盒中独立查找和验证 bug,确保报告的每个问题都经过确认。
核心价值: 低于 1% 误报率、多智能体并行探索、独立验证机制。
一、Ultrareview 是什么
1.1 核心能力
| 能力 | 说明 |
|---|---|
| 多智能体舰队 | 5-20 个智能体并行探索 diff,每个从不同角度 |
| 独立验证 | 每个候选发现由独立智能体重现,确认后才报告 |
| 低于 1% 误报率 | 验证阶段过滤未确认发现 |
| 云端沙盒执行 | 审查在 Anthropic 基础设施运行,终端保持空闲 |
| 后台操作 | 确认启动后审查在后台运行,可用 /tasks 监控 |
| 双调用模式 | 分支模式(捆绑本地工作树)和 PR 模式(直接从 GitHub 克隆) |
1.2 与 /review 的区别
/review |
/ultrareview |
|
|---|---|---|
| 运行位置 | 本地,当前会话中 | 远程,云端沙盒 |
| 深度 | 单次审查 | 多智能体舰队 + 独立验证 |
| 时长 | 秒到几分钟 | 约 5-20 分钟 |
| 成本 | 计入正常用量 | 3 次免费(Pro/Max),之后约 $5-20/次 |
| 适合场景 | 快速反馈 | 高风险变更的预合并信心 |
总结: /review 是烟雾探测器(常开、快速),/ultrareview 是结构检查(签字前高风险变更的深度检查)。
二、如何工作
2.1 四阶段架构
阶段 1:设置(约 90 秒)
- 调配远程基础设施
- 生成智能体舰队(默认 5 个,支持最多 20 个)
阶段 2:查找(并行探索)
- 逻辑专家:控制流、边界情况、架构一致性
- 安全审计:注入、认证缺陷、不安全数据处理
- 性能优化:低效算法、N+1 查询、内存泄漏
- 验证负责人:协调并确保可重现性
阶段 3:验证(差异化因素)
- 一组独立智能体尝试重现每个候选发现
- 无法确认的不报告
阶段 4:报告
- 文件位置和行号
- 严重性标签
- Bug 描述和证据
- 可直接交给 Claude 修复的上下文
三、价格
3.1 Claude Code 订阅
Claude Code 捆绑在所有 Claude 计划中(Pro、Max、Team、Enterprise)。
| 计划 | 价格 | Claude Code 访问 | Ultrareview 额外用量 |
|---|---|---|---|
| Pro | $20/月 | ✅ 包含 | 3 次免费,之后约 $5-20/次 |
| Max 5x | $100/月 | ✅ 包含 | 3 次免费,之后约 $5-20/次 |
| Max 20x | $200/月 | ✅ 包含 | 3 次免费,之后约 $5-20/次 |
| Team Standard | $25/人/月 | ✅ 包含 | 无免费,立即计费 |
| Team Premium | $125/人/月 | ✅ 包含 | 无免费,立即计费 |
| Enterprise | $20/人 + API 用量 | ✅ 包含 | 自定义计费 |
| Free | $0 | ❌ 不包含 | N/A |
3.2 重要提醒
- 3 次免费运行(Pro/Max)截至 2026 年 5 月 5 日
- Team 和 Enterprise 无免费运行,从第一次开始计费
- 之后每次审查约 $5-20
- 需通过
/extra-usage启用才能运行付费审查
四、用 Ultrareview 审查 Vibe Code
4.1 为什么适合 Vibe Code
AI 生成的代码以冗长、幻觉 API、无意义循环著称。Vibe-coded PR 往往大而复杂,易出错。
Ultrareview 的优势:
| Vibe Code 问题 | Ultrareview 方案 |
|---|---|
| 跨模块类型不匹配 | 智能体舰队并行探索不同执行路径 |
| Race conditions | 多智能体交叉检查,捕捉单次审查遗漏的问题 |
| 控制流逻辑错误 | 5 个智能体从不同角度探索,再交叉验证 |
| 幻觉函数调用 | 验证阶段尝试重现声称的问题 |
4.2 Vibe Code 工作流
| PR 类型 | 工具 | 原因 |
|---|---|---|
| 每个 PR(快速循环) | /review(<5 分钟) |
常开烟雾检查 |
| 大型/关键 PR(500+ 行) | /ultrareview(10-20 分钟) |
预合并深度检查 |
| 基础设施变更(DB 迁移、安全) | /ultrareview |
最高信心 |
4.3 最佳实践
- 先用
/review作为快速反馈循环 - 保留
/ultrareview用于涉及 auth、支付或基础设施的预合并 - 将大型 vibe-coded PR 拆分为更小的块
- 在
CLAUDE.md和REVIEW.md中编码业务不变量
五、快速开始
5.1 基本使用
# 审查当前分支 vs 默认分支
claude --ultrareview
# 审查特定 PR
claude /ultrareview 1234
# 后台运行
claude --ultrareview &
/tasks # 监控进度
# 查看任务状态
/tasks
5.2 启用额外用量
/extra-usage
# 启用后可以运行付费审查
5.3 查看结果
🔴 Critical: src/auth/login.ts:45
SQL 注入风险:用户输入直接拼接到查询
修复:使用参数化查询
🟡 Major: src/api/users.ts:78
缺失错误处理:网络请求无 try-catch
修复:添加 try-catch 块
5.4 GitHub Action 集成
name: Claude Auto PR Review
on:
pull_request:
types: [opened, synchronize]
jobs:
claude-review:
runs-on: ubuntu-latest
permissions:
contents: read
pull-requests: write
steps:
- uses: anthropics/claude-code-action@v1
with:
anthropic_api_key: ${{ secrets.ANTHROPIC_API_KEY }}
prompt: |
Review this pull request. Focus on:
- Logic errors and edge cases
- Security issues (injection, auth, secrets)
- Performance regressions
- Missing error handling
Format response as:
## Summary
One paragraph describing the change.
## Issues Found
Numbered list with severity (Critical/Major/Minor), file:line.
六、GitHub 集成
6.1 托管代码审查(研究预览)
要求: Team 或 Enterprise 计划
- 通过 Claude.ai admin settings → Code Review 启用
- 在组织级别安装 Claude GitHub App
- PR 打开/推送时自动审查
- 发布行内评论和总结
不支持: Bedrock、Vertex AI、Microsoft Foundry、ZDR 组织
6.2 GitHub Action(自托管)
任何计划可用(包括 Pro、API)
# 在 workflow 中
- uses: anthropics/claude-code-action@v1
with:
anthropic_api_key: ${{ secrets.ANTHROPIC_API_KEY }}
6.3 手动命令
| 命令 | 功能 |
|---|---|
@claude review |
开始审查并订阅推送触发的审查 |
@claude review once |
单次审查,不订阅未来推送 |
/ultrareview <PR-number> |
通过 PR 编号云端深度审查 |
/ultrareview |
云端深度审查当前分支 vs 默认分支 |
七、优缺点
7.1 优点
| 优点 | 说明 |
|---|---|
| 最高信号质量 | 独立 bug 验证产生低于 1% 误报率 |
| 并行多智能体探索 | 捕获 race conditions、跨模块类型不匹配 |
| 无本地资源使用 | 审查在云沙盒运行;终端保持空闲 |
| 后台操作 | 确认启动后异步运行;可关闭终端 |
| GitHub PR 模式 | 沙盒直接从 GitHub 克隆 |
| CI/脚本支持 | claude ultrareview 子命令可在脚本和 CI 中使用 |
| 关键 PR 成本效益 | $5-20/次 vs 生产 bug 的成本 |
7.2 缺点
| 缺点 | 说明 |
|---|---|
| 需要 Pro/Max/Team/Enterprise | Free 用户无法访问 |
| ZDR 组织不兼容 | 无法在零数据保留配置下使用 |
| 5-20 分钟延迟 | 太慢不适合 CI 门控合并 |
| 仅 diff 审查 | 只审查 diff vs 默认分支 |
| 免费运行截至 2026 年 5 月 5 日 | 有限时间优惠 |
| Team/Enterprise 无免费 | 从第一次开始计费 |
| 大仓库无法捆绑 | 必须使用 PR 模式(草稿 PR) |
八、与替代工具对比
8.1 核心对比
| 工具 | 价格 | 误报率 | 审查时间 | 核心优势 |
|---|---|---|---|---|
Claude Code /ultrareview |
$5-20/次 | <1% | 5-20 分钟 | 最高信号,独立验证 |
Claude Code /review |
包含在订阅中 | 中等 | 秒-分钟 | 快速本地反馈 |
| CodeRabbit | 免费/$24/人/月 | ~15% | ~90 秒 | 40+ linter,跨平台 |
| Qodo Merge | $30/人/月 | ~25% | 2-4 分钟 | 测试生成,自托管 |
| GitHub Copilot Review | $19/人/月 | ~29% 沉默率 | ~5 分钟 | 零集成摩擦 |
| Greptile | $30/人/月 | 低 | 快 | 跨文件上下文 |
8.2 选择建议
| 场景 | 推荐 |
|---|---|
| 高风险 PR(auth/支付/基础设施) | Claude Code /ultrareview |
| 预算内每个 PR 审查 | CodeRabbit |
| 需要测试生成 | Qodo |
| GitHub 原生团队 | GitHub Copilot Review |
| 大型 Monorepo | Greptile |
| 已用 Claude Code 作为主要编码工具 | Claude Code /review 或 /ultrareview |
九、总结
Ultrareview 核心特点:
| 方面 | 说明 |
|---|---|
| 信号质量 | 低于 1% 误报率(验证确认) |
| 方法 | 多智能体舰队 + 独立验证 |
| 成本 | $5-20/次(3 次免费截至 2026 年 5 月 5 日) |
| 时长 | 5-20 分钟 |
| 最佳场景 | 高风险预合并审查 |
对于 Vibe Code:
- ✅ 独立验证捕获 AI 幻觉
- ✅ 多智能体并行探索捕获跨模块问题
- ✅ 低于 1% 误报率,高信心
不是:
- ❌ 每个 PR 的常开审查(用
/review或 CodeRabbit) - ❌ CI 自动化(太慢)
- ❌ Free 用户可用