AI Testing Agent 使用说明

一句话定位

AI Testing Agent 不是普通脚本测试器，而是一个由测试负责人、真实用户、挑剔客户、回归测试员和监督员组成的工作流。默认规则是：只测试、记录和报告，不擅自修改业务代码。

目录结构

路径	用途
`docs/testing-agent/`	通用测试 Agent 模板，包括角色、场景、任务卡、报告模板、Codex 调用提示词。
`docs/testing-agent/reports/`	测试报告样例和后续新报告保存位置。
`examples/sagemates-uat4/`	营销 Agent 项目的 UAT 4 样例，包括交付范围、UAT 清单、监督规则、验证记录、最终交接报告。
`plans/`	多 Agent 研发执行计划样例。
`scripts/`	项目级 smoke 脚本示例，可复制到具体项目中改造。
`使用说明.html`	当前说明文件。

核心文件怎么用

1. 先读入口提示词

打开 CODEX_TEST_AGENT_PROMPT.md，把里面的提示词复制给 Codex 或 Claude Code。

2. 选择测试角色

从 PERSONAS.md 选择角色，例如 Owner、运营专员、海外买家、内部客户经理。

3. 选择测试场景

从 SCENARIOS.md 选择真实任务，例如登录、查看业务现状、处理任务、查看报告、AI 边界检查。

4. 输出测试报告

按 REPORT_TEMPLATE.md 输出 Go / No-Go、P0/P1/P2 问题、复现步骤和下一步建议。

推荐调用方式

每日开发结束后

你现在是项目专用 Codex 测试 Agent。
请读取 docs/testing-agent/CODEX_TEST_AGENT_PROMPT.md。

本次阶段：开发中
测试目标：做一次 30 分钟以内的冒烟测试和角色体验测试。
测试角色：Owner、运营专员、内部客户经理。
重点：登录、核心页面、任务、报告、权限边界、移动端基本体验。

只测试，不改代码。请输出测试报告。

交付前 UAT

你现在是挑剔客户视角的 AI 验收官。
请读取 docs/testing-agent/CODEX_TEST_AGENT_PROMPT.md。

本次阶段：交付前 UAT
测试目标：判断这个版本是否适合交给真实用户试用。
测试角色：Owner、新手用户、运营人员、内部管理员。

请输出：
1. Go / No-Go 结论
2. P0/P1/P2 问题清单
3. 角色体验观察
4. 业务风险
5. 下一步修复建议

修复后回归

请读取上一份测试报告。
只复测其中 P0/P1 问题。
不要扩大范围，除非发现新的 P0 风险。
请输出 Fixed / Partially Fixed / Still Open / Not Reproducible。

如何复制到新项目

把 docs/testing-agent/ 复制到目标项目的 docs/testing-agent/。
为目标项目新增一份项目专属 PROJECT_TESTING.md 或 UAT 清单。
把目标项目的角色写进 PERSONAS.md。
把目标项目的核心业务流程写进 SCENARIOS.md。
每次测试后，把报告放进 docs/testing-agent/reports/。
如果需要自动 smoke，把 scripts/sagemates-uat-smoke.example.mjs 复制到目标项目并改接口地址、账号和断言。

smoke 脚本示例

已迁移脚本：scripts/sagemates-uat-smoke.example.mjs。

在具体项目中使用时，建议放到项目的 frontend/scripts/uat-smoke.mjs，并在 package.json 增加：

{
  "scripts": {
    "uat:smoke": "node scripts/uat-smoke.mjs"
  }
}

运行：

npm run uat:smoke

监督规则

任何 Agent 声称完成，都必须有证据。没有命令、输出、截图、API 响应或报告，不得算完成。

开发 Agent 不能自签完成。
测试 Agent 默认不改业务代码。
审查 Agent 不替开发者补证据。
监督 Agent 只按证据放行。
涉及真实账号、真实广告、真实发布、真实外部写入时，默认 No-Go。

监督清单样例见 69_Agent_Supervision_And_Evidence_Checklist.md。

报告与样例

文件	说明
UAT 4 测试报告	测试 Agent 交付报告样例。
UAT 4 用户交接报告	交付给项目负责人的最终 UAT 包样例。
代码审查与漂移报告	检查代码、SOP、UAT 范围是否一致。
多 Agent 执行计划	如何拆分开发、测试、审查、监督和纠偏角色。

最小工作流

项目进入一个阶段，比如需求、开发中、交付前或修复后。
填写 TASK_CARD_TEMPLATE.md。
让测试 Agent 读取 CODEX_TEST_AGENT_PROMPT.md。
测试 Agent 按角色和场景执行测试。
报告输出到 docs/testing-agent/reports/。
开发 Agent 修复 P0/P1。
测试 Agent 只复测 P0/P1。
监督 Agent 检查证据，决定 Go / No-Go。