AI Coding SOP 严格开发交付标准 v2 使用手册

一份给真实开发使用的操作手册:先定交付标准,再按项目规模裁剪;默认 Codex-only,检测到设计 Agent 产物后再确认切换。

1. 这份手册解决什么

这套 SOP 的目标不是让 AI 多写文档,而是让 AI 开发过程可控、可验收、可复盘。你应该把它当成一个开发交付标准,而不是单次提示词。

核心规则:所有开发默认走 Codex-only;如果提供了设计 Agent 的前端设计方案,Codex 必须识别并询问你是否切换到 Design-Agent + Codex。

它会约束什么

  • 需求是否清楚
  • 设计是否完整
  • 开发计划是否可执行
  • 测试证据是否存在
  • 交付是否能验收

它不会强制什么

  • 不会要求所有小任务都写满 17 份文档
  • 不会让设计 Agent 接管生产代码
  • 不会替你静默切换流程
  • 不会把文档当成最终成果

2. 5 分钟快速开始

  1. 在项目根目录准备或更新 AGENTS.md
  2. AGENTS 自动应用规则 中的片段复制进去。
  3. 新任务开始时,让 Codex 先判断任务等级:L0L4
  4. 让 Codex 创建任务目录:docs/tasks/YYYY-MM-DD-task-name/
  5. 先产出 00-tailoring-decision.md,确认哪些文档必须写、哪些可以裁剪。
  6. 09-development-plan.md 确认前,不让 Codex 写代码。
  7. 开发完成后,必须有 13-test-report.md17-delivery-summary.md

推荐启动提示词

本任务请严格采用 AI Coding SOP v2。

请先不要写代码,先完成:
1. 读取 AGENTS.md 和项目上下文。
2. 判断任务等级 L0-L4。
3. 判断是否存在设计 Agent 产物。
4. 生成 00-tailoring-decision.md,列出必需文档和裁剪文档。
5. 根据裁剪结果生成 PRD、设计方案、测试用例和开发计划。
6. 等我确认 development-plan 后再开始编码。

3. 选择开发模式

模式选择只影响前端设计来源,不影响完整交付链路。系统设计、数据库设计、接口设计、测试报告、交付总结仍然需要按 SOP 执行。

默认
Codex-only
检测
是否存在设计 Agent 产物
确认
询问用户是否切换
执行
按确认后的模式开发
模式 何时使用 谁负责前端设计 谁负责生产代码
Codex-only 默认;后台、工具、MVP、常规业务功能 Codex Codex
Design-Agent + Codex 已有 Figma、原型图、UI Design Spec、设计 Agent 方案 Design Agent Codex
不要让多 Agent 同时修改生产前端代码。Design Agent 交付设计产物,Codex 统一落地工程实现。

4. 选择裁剪等级

先完整定义标准,再根据任务裁剪。裁剪必须写进 00-tailoring-decision.md

等级 适用场景 最低要求
L0 文案、小样式、单文件 bug 任务摘要、实现计划、验证报告、交付总结
L1 小功能、单页面、单接口 PRD、简版设计、测试用例、测试报告、交付总结
L2 标准业务功能 PRD、需求分析、系统设计、条件设计文档、开发日志、测试报告
L3 跨模块、数据库、外部集成、复杂前端流程 完整设计包、任务拆解、代码审查、集成报告、验收报告
L4 生产核心、高风险、支付、权限、数据安全 L3 全量文档 + 安全/性能/回滚/发布审批证据

5. 创建过程文档

建议每个任务使用独立目录。小任务可以合并文档,但必须保留对应章节。

docs/tasks/YYYY-MM-DD-task-name/
  00-tailoring-decision.md
  01-prd.md
  02-requirements-analysis.md
  03-system-design.md
  04-database-design.md
  05-api-integration-design.md
  06-frontend-design.md
  07-security-permission-design.md
  08-test-case-design.md
  09-development-plan.md
  10-task-breakdown.md
  11-development-log.md
  12-code-review-report.md
  13-test-report.md
  14-integration-report.md
  15-deployment-rollback-plan.md
  16-acceptance-report.md
  17-delivery-summary.md
  design/
  references/

什么时候必须写专项设计

触发条件 必须文档
新增表、字段、索引、迁移、查询模式 04-database-design.md
前后端接口、外部 API、Webhook、消息队列 05-api-integration-design.md
新页面、新组件、响应式、交互状态 06-frontend-design.md
登录、权限、敏感数据、文件上传、外部输入 07-security-permission-design.md
任何实现任务 08-test-case-design.md13-test-report.md

6. Codex-only 用法

这是默认模式。Codex 负责完整交付链路,但仍必须先写计划再开发。

操作顺序

  1. 让 Codex 判断任务等级。
  2. 让 Codex 生成 00-tailoring-decision.md
  3. 让 Codex 生成 PRD、系统设计和触发的专项设计。
  4. 让 Codex 生成测试用例设计。
  5. 让 Codex 生成开发计划。
  6. 你确认开发计划后,Codex 开始编码。
  7. Codex 维护开发日志。
  8. Codex 运行测试并生成报告。
  9. Codex 生成验收报告和交付总结。

Codex-only 提示词

本任务采用 Codex-only SOP。

请按 AI Coding SOP v2 执行:
1. 判断任务等级和裁剪范围。
2. 创建 docs/tasks/YYYY-MM-DD-task-name/。
3. 生成 00-tailoring-decision.md。
4. 根据任务范围生成必要设计文档,包括系统、数据库、接口、前端、安全、测试。
5. 生成 09-development-plan.md,等待我确认。
6. 确认后再编码。
7. 开发过程维护 11-development-log.md。
8. 完成后生成 13-test-report.md、16-acceptance-report.md、17-delivery-summary.md。

7. Design-Agent + Codex 用法

这个模式只在你提供设计 Agent 的前端设计产物时启用。它不替代完整开发 SOP,只替换前端设计来源。

必须提供的设计 Agent 产物

  • design/ui-design-spec.md
  • design/design-agent-handoff.md
  • design/prototype.md 或可访问的 Figma/截图/HTML 原型

Codex 应该做什么

  1. 检测到设计产物后询问你是否切换。
  2. 确认后审查设计交付物是否完整。
  3. 如果不完整,列出缺口,而不是直接猜。
  4. 将 UI Design Spec 映射到组件、样式、状态和测试。
  5. 由 Codex 实现生产代码。
  6. 用截图对照设计方案。

切换提示词

我已提供设计 Agent 的前端设计产物。

请先不要写代码:
1. 检查是否满足 Design-Agent + Codex SOP 的最低交付物。
2. 如果满足,请询问我是否确认切换到 Design-Agent + Codex。
3. 我确认后,你再审查 UI Design Spec、Handoff 和 Prototype。
4. 将设计映射到系统设计、组件实现、测试用例和开发计划。
5. 生产代码仍由 Codex 统一实现。
6. 完成后用桌面和移动端截图对照设计。

8. 开发过程中怎么推进

开发过程中不要只盯代码。你应该让 Codex 维护执行证据。

阶段 你要看什么 不通过怎么办
开发前 09-development-plan.md 是否具体可执行 要求拆小任务,不准直接编码
开发中 11-development-log.md 是否记录偏离和决策 要求补日志,并解释偏离原因
开发后 13-test-report.md 是否有命令和结果 要求运行验证或记录不能运行的原因
前端后 是否有桌面和移动端视觉 QA 要求截图检查并继续 polish
交付前 17-delivery-summary.md 是否说明风险 要求补充已知限制和后续项

9. 测试、验收和交付

完成不是“代码写完”。完成必须有证据。

完成前检查

  • PRD 验收标准是否逐项满足。
  • 设计文档是否没有被随意偏离。
  • 数据库、接口、前端、安全变更是否有对应设计。
  • 测试用例是否覆盖核心验收标准。
  • 测试报告是否记录命令和结果。
  • 前端是否完成视觉 QA。
  • 交付总结是否说明风险和后续项。
禁止:没有测试报告就说“已完成”;没有视觉 QA 就说“前端完成”;没有回滚方案就发布数据库迁移。

10. 常用提示词

让 Codex 判断任务等级

请根据 AI Coding SOP v2 判断这个任务属于 L0-L4 哪个等级。

请输出:
1. 等级
2. 判断理由
3. 必须文档
4. 可以裁剪的文档
5. 裁剪风险
6. 是否涉及系统、数据库、接口、前端、安全、测试、部署

让 Codex 补齐设计方案

请根据当前 PRD 和需求分析,补齐设计方案文档。

必须判断是否需要:
- system-design
- database-design
- api-integration-design
- frontend-design
- security-permission-design
- test-case-design
- deployment-rollback-plan

只生成被触发的文档,并说明未生成文档的裁剪理由。

让 Codex 做完成前检查

请按 AI Coding SOP v2 做完成前检查。

检查:
1. 必需过程文档是否存在。
2. 裁剪项是否有理由。
3. PRD 验收标准是否满足。
4. 设计方案是否被遵守。
5. 测试报告是否有命令和结果。
6. 前端是否有视觉 QA。
7. 交付总结是否完整。

如果缺失,请继续补齐,不要直接宣布完成。

11. 常见错误

错误 后果 正确做法
一开始就让 Codex 写代码 需求和设计被模型猜测 先裁剪、再设计、再计划、再开发
把 SOP 当成必须全写的文档清单 小任务过重 使用 L0-L4 裁剪等级
设计 Agent 直接改生产代码 代码风格、架构和状态管理分裂 设计 Agent 交付设计,Codex 落地代码
没有接口设计就前后端并行 集成返工 先写 API 契约和错误码
测试报告只写“通过” 没有证据 记录命令、结果、失败和修复