AI 验收官 真人试用员 回归测试员

AI Testing Agent 使用说明

这是一个可复用的 AI 测试 Agent 工具包,用于让 Codex、Claude Code 或其他编码 Agent 像真实用户一样测试项目,并输出可交付、可复测、可审查的 UAT 报告。

一句话定位

AI Testing Agent 不是普通脚本测试器,而是一个由测试负责人、真实用户、挑剔客户、回归测试员和监督员组成的工作流。默认规则是:只测试、记录和报告,不擅自修改业务代码。

目录结构

路径 用途
docs/testing-agent/ 通用测试 Agent 模板,包括角色、场景、任务卡、报告模板、Codex 调用提示词。
docs/testing-agent/reports/ 测试报告样例和后续新报告保存位置。
examples/sagemates-uat4/ 营销 Agent 项目的 UAT 4 样例,包括交付范围、UAT 清单、监督规则、验证记录、最终交接报告。
plans/ 多 Agent 研发执行计划样例。
scripts/ 项目级 smoke 脚本示例,可复制到具体项目中改造。
使用说明.html 当前说明文件。

核心文件怎么用

1. 先读入口提示词

打开 CODEX_TEST_AGENT_PROMPT.md,把里面的提示词复制给 Codex 或 Claude Code。

2. 选择测试角色

PERSONAS.md 选择角色,例如 Owner、运营专员、海外买家、内部客户经理。

3. 选择测试场景

SCENARIOS.md 选择真实任务,例如登录、查看业务现状、处理任务、查看报告、AI 边界检查。

4. 输出测试报告

REPORT_TEMPLATE.md 输出 Go / No-Go、P0/P1/P2 问题、复现步骤和下一步建议。

推荐调用方式

每日开发结束后

你现在是项目专用 Codex 测试 Agent。
请读取 docs/testing-agent/CODEX_TEST_AGENT_PROMPT.md。

本次阶段:开发中
测试目标:做一次 30 分钟以内的冒烟测试和角色体验测试。
测试角色:Owner、运营专员、内部客户经理。
重点:登录、核心页面、任务、报告、权限边界、移动端基本体验。

只测试,不改代码。请输出测试报告。

交付前 UAT

你现在是挑剔客户视角的 AI 验收官。
请读取 docs/testing-agent/CODEX_TEST_AGENT_PROMPT.md。

本次阶段:交付前 UAT
测试目标:判断这个版本是否适合交给真实用户试用。
测试角色:Owner、新手用户、运营人员、内部管理员。

请输出:
1. Go / No-Go 结论
2. P0/P1/P2 问题清单
3. 角色体验观察
4. 业务风险
5. 下一步修复建议

修复后回归

请读取上一份测试报告。
只复测其中 P0/P1 问题。
不要扩大范围,除非发现新的 P0 风险。
请输出 Fixed / Partially Fixed / Still Open / Not Reproducible。

如何复制到新项目

  1. docs/testing-agent/ 复制到目标项目的 docs/testing-agent/
  2. 为目标项目新增一份项目专属 PROJECT_TESTING.md 或 UAT 清单。
  3. 把目标项目的角色写进 PERSONAS.md
  4. 把目标项目的核心业务流程写进 SCENARIOS.md
  5. 每次测试后,把报告放进 docs/testing-agent/reports/
  6. 如果需要自动 smoke,把 scripts/sagemates-uat-smoke.example.mjs 复制到目标项目并改接口地址、账号和断言。

smoke 脚本示例

已迁移脚本:scripts/sagemates-uat-smoke.example.mjs

在具体项目中使用时,建议放到项目的 frontend/scripts/uat-smoke.mjs,并在 package.json 增加:

{
  "scripts": {
    "uat:smoke": "node scripts/uat-smoke.mjs"
  }
}

运行:

npm run uat:smoke

监督规则

任何 Agent 声称完成,都必须有证据。没有命令、输出、截图、API 响应或报告,不得算完成。

监督清单样例见 69_Agent_Supervision_And_Evidence_Checklist.md

报告与样例

文件 说明
UAT 4 测试报告 测试 Agent 交付报告样例。
UAT 4 用户交接报告 交付给项目负责人的最终 UAT 包样例。
代码审查与漂移报告 检查代码、SOP、UAT 范围是否一致。
多 Agent 执行计划 如何拆分开发、测试、审查、监督和纠偏角色。

最小工作流

  1. 项目进入一个阶段,比如需求、开发中、交付前或修复后。
  2. 填写 TASK_CARD_TEMPLATE.md
  3. 让测试 Agent 读取 CODEX_TEST_AGENT_PROMPT.md
  4. 测试 Agent 按角色和场景执行测试。
  5. 报告输出到 docs/testing-agent/reports/
  6. 开发 Agent 修复 P0/P1。
  7. 测试 Agent 只复测 P0/P1。
  8. 监督 Agent 检查证据,决定 Go / No-Go。