用 Claude Code Ultrareview 审查 Vibe Code

概述

Vibe Code 指用 AI 编程工具生成的代码,通常质量参差不齐,需要额外审查。

Claude Code Ultrareview 是 Claude Code 中的云端多智能体代码审查命令,启动一组专业审查智能体在远程沙盒中独立查找和验证 bug,确保报告的每个问题都经过确认。

核心价值: 低于 1% 误报率、多智能体并行探索、独立验证机制。


一、Ultrareview 是什么

1.1 核心能力

能力 说明
多智能体舰队 5-20 个智能体并行探索 diff,每个从不同角度
独立验证 每个候选发现由独立智能体重现,确认后才报告
低于 1% 误报率 验证阶段过滤未确认发现
云端沙盒执行 审查在 Anthropic 基础设施运行,终端保持空闲
后台操作 确认启动后审查在后台运行,可用 /tasks 监控
双调用模式 分支模式(捆绑本地工作树)和 PR 模式(直接从 GitHub 克隆)

1.2 与 /review 的区别

/review /ultrareview
运行位置 本地,当前会话中 远程,云端沙盒
深度 单次审查 多智能体舰队 + 独立验证
时长 秒到几分钟 约 5-20 分钟
成本 计入正常用量 3 次免费(Pro/Max),之后约 $5-20/次
适合场景 快速反馈 高风险变更的预合并信心

总结: /review 是烟雾探测器(常开、快速),/ultrareview 是结构检查(签字前高风险变更的深度检查)。


二、如何工作

2.1 四阶段架构

阶段 1:设置(约 90 秒)
  - 调配远程基础设施
  - 生成智能体舰队(默认 5 个,支持最多 20 个)

阶段 2:查找(并行探索)
  - 逻辑专家:控制流、边界情况、架构一致性
  - 安全审计:注入、认证缺陷、不安全数据处理
  - 性能优化:低效算法、N+1 查询、内存泄漏
  - 验证负责人:协调并确保可重现性

阶段 3:验证(差异化因素)
  - 一组独立智能体尝试重现每个候选发现
  - 无法确认的不报告

阶段 4:报告
  - 文件位置和行号
  - 严重性标签
  - Bug 描述和证据
  - 可直接交给 Claude 修复的上下文

三、价格

3.1 Claude Code 订阅

Claude Code 捆绑在所有 Claude 计划中(Pro、Max、Team、Enterprise)。

计划 价格 Claude Code 访问 Ultrareview 额外用量
Pro $20/月 ✅ 包含 3 次免费,之后约 $5-20/次
Max 5x $100/月 ✅ 包含 3 次免费,之后约 $5-20/次
Max 20x $200/月 ✅ 包含 3 次免费,之后约 $5-20/次
Team Standard $25/人/月 ✅ 包含 无免费,立即计费
Team Premium $125/人/月 ✅ 包含 无免费,立即计费
Enterprise $20/人 + API 用量 ✅ 包含 自定义计费
Free $0 ❌ 不包含 N/A

3.2 重要提醒

  • 3 次免费运行(Pro/Max)截至 2026 年 5 月 5 日
  • Team 和 Enterprise 无免费运行,从第一次开始计费
  • 之后每次审查约 $5-20
  • 需通过 /extra-usage 启用才能运行付费审查

四、用 Ultrareview 审查 Vibe Code

4.1 为什么适合 Vibe Code

AI 生成的代码以冗长、幻觉 API、无意义循环著称。Vibe-coded PR 往往大而复杂,易出错。

Ultrareview 的优势:

Vibe Code 问题 Ultrareview 方案
跨模块类型不匹配 智能体舰队并行探索不同执行路径
Race conditions 多智能体交叉检查,捕捉单次审查遗漏的问题
控制流逻辑错误 5 个智能体从不同角度探索,再交叉验证
幻觉函数调用 验证阶段尝试重现声称的问题

4.2 Vibe Code 工作流

PR 类型 工具 原因
每个 PR(快速循环) /review(<5 分钟) 常开烟雾检查
大型/关键 PR(500+ 行) /ultrareview(10-20 分钟) 预合并深度检查
基础设施变更(DB 迁移、安全) /ultrareview 最高信心

4.3 最佳实践

  1. 先用 /review 作为快速反馈循环
  2. 保留 /ultrareview 用于涉及 auth、支付或基础设施的预合并
  3. 将大型 vibe-coded PR 拆分为更小的块
  4. CLAUDE.mdREVIEW.md 中编码业务不变量

五、快速开始

5.1 基本使用

# 审查当前分支 vs 默认分支
claude --ultrareview

# 审查特定 PR
claude /ultrareview 1234

# 后台运行
claude --ultrareview &
/tasks  # 监控进度

# 查看任务状态
/tasks

5.2 启用额外用量

/extra-usage
# 启用后可以运行付费审查

5.3 查看结果

🔴 Critical: src/auth/login.ts:45
   SQL 注入风险:用户输入直接拼接到查询
   修复:使用参数化查询

🟡 Major: src/api/users.ts:78
   缺失错误处理:网络请求无 try-catch
   修复:添加 try-catch 块

5.4 GitHub Action 集成

name: Claude Auto PR Review
on:
  pull_request:
    types: [opened, synchronize]

jobs:
  claude-review:
    runs-on: ubuntu-latest
    permissions:
      contents: read
      pull-requests: write
    steps:
      - uses: anthropics/claude-code-action@v1
        with:
          anthropic_api_key: ${{ secrets.ANTHROPIC_API_KEY }}
          prompt: |
            Review this pull request. Focus on:
            - Logic errors and edge cases
            - Security issues (injection, auth, secrets)
            - Performance regressions
            - Missing error handling
            
            Format response as:
            ## Summary
            One paragraph describing the change.
            
            ## Issues Found
            Numbered list with severity (Critical/Major/Minor), file:line.

六、GitHub 集成

6.1 托管代码审查(研究预览)

要求: Team 或 Enterprise 计划

  1. 通过 Claude.ai admin settings → Code Review 启用
  2. 在组织级别安装 Claude GitHub App
  3. PR 打开/推送时自动审查
  4. 发布行内评论和总结

不支持: Bedrock、Vertex AI、Microsoft Foundry、ZDR 组织

6.2 GitHub Action(自托管)

任何计划可用(包括 Pro、API)

# 在 workflow 中
- uses: anthropics/claude-code-action@v1
  with:
    anthropic_api_key: ${{ secrets.ANTHROPIC_API_KEY }}

6.3 手动命令

命令 功能
@claude review 开始审查并订阅推送触发的审查
@claude review once 单次审查,不订阅未来推送
/ultrareview <PR-number> 通过 PR 编号云端深度审查
/ultrareview 云端深度审查当前分支 vs 默认分支

七、优缺点

7.1 优点

优点 说明
最高信号质量 独立 bug 验证产生低于 1% 误报率
并行多智能体探索 捕获 race conditions、跨模块类型不匹配
无本地资源使用 审查在云沙盒运行;终端保持空闲
后台操作 确认启动后异步运行;可关闭终端
GitHub PR 模式 沙盒直接从 GitHub 克隆
CI/脚本支持 claude ultrareview 子命令可在脚本和 CI 中使用
关键 PR 成本效益 $5-20/次 vs 生产 bug 的成本

7.2 缺点

缺点 说明
需要 Pro/Max/Team/Enterprise Free 用户无法访问
ZDR 组织不兼容 无法在零数据保留配置下使用
5-20 分钟延迟 太慢不适合 CI 门控合并
仅 diff 审查 只审查 diff vs 默认分支
免费运行截至 2026 年 5 月 5 日 有限时间优惠
Team/Enterprise 无免费 从第一次开始计费
大仓库无法捆绑 必须使用 PR 模式(草稿 PR)

八、与替代工具对比

8.1 核心对比

工具 价格 误报率 审查时间 核心优势
Claude Code /ultrareview $5-20/次 <1% 5-20 分钟 最高信号,独立验证
Claude Code /review 包含在订阅中 中等 秒-分钟 快速本地反馈
CodeRabbit 免费/$24/人/月 ~15% ~90 秒 40+ linter,跨平台
Qodo Merge $30/人/月 ~25% 2-4 分钟 测试生成,自托管
GitHub Copilot Review $19/人/月 ~29% 沉默率 ~5 分钟 零集成摩擦
Greptile $30/人/月 跨文件上下文

8.2 选择建议

场景 推荐
高风险 PR(auth/支付/基础设施) Claude Code /ultrareview
预算内每个 PR 审查 CodeRabbit
需要测试生成 Qodo
GitHub 原生团队 GitHub Copilot Review
大型 Monorepo Greptile
已用 Claude Code 作为主要编码工具 Claude Code /review/ultrareview

九、总结

Ultrareview 核心特点:

方面 说明
信号质量 低于 1% 误报率(验证确认)
方法 多智能体舰队 + 独立验证
成本 $5-20/次(3 次免费截至 2026 年 5 月 5 日)
时长 5-20 分钟
最佳场景 高风险预合并审查

对于 Vibe Code:

  • ✅ 独立验证捕获 AI 幻觉
  • ✅ 多智能体并行探索捕获跨模块问题
  • ✅ 低于 1% 误报率,高信心

不是:

  • ❌ 每个 PR 的常开审查(用 /review 或 CodeRabbit)
  • ❌ CI 自动化(太慢)
  • ❌ Free 用户可用

参考来源