一句话定位
AI Testing Agent 不是普通脚本测试器,而是一个由测试负责人、真实用户、挑剔客户、回归测试员和监督员组成的工作流。默认规则是:只测试、记录和报告,不擅自修改业务代码。
目录结构
| 路径 | 用途 |
|---|---|
docs/testing-agent/ |
通用测试 Agent 模板,包括角色、场景、任务卡、报告模板、Codex 调用提示词。 |
docs/testing-agent/reports/ |
测试报告样例和后续新报告保存位置。 |
examples/sagemates-uat4/ |
营销 Agent 项目的 UAT 4 样例,包括交付范围、UAT 清单、监督规则、验证记录、最终交接报告。 |
plans/ |
多 Agent 研发执行计划样例。 |
scripts/ |
项目级 smoke 脚本示例,可复制到具体项目中改造。 |
使用说明.html |
当前说明文件。 |
核心文件怎么用
1. 先读入口提示词
打开 CODEX_TEST_AGENT_PROMPT.md,把里面的提示词复制给 Codex 或 Claude Code。
2. 选择测试角色
从 PERSONAS.md 选择角色,例如 Owner、运营专员、海外买家、内部客户经理。
3. 选择测试场景
从 SCENARIOS.md 选择真实任务,例如登录、查看业务现状、处理任务、查看报告、AI 边界检查。
4. 输出测试报告
按 REPORT_TEMPLATE.md 输出 Go / No-Go、P0/P1/P2 问题、复现步骤和下一步建议。
推荐调用方式
每日开发结束后
你现在是项目专用 Codex 测试 Agent。
请读取 docs/testing-agent/CODEX_TEST_AGENT_PROMPT.md。
本次阶段:开发中
测试目标:做一次 30 分钟以内的冒烟测试和角色体验测试。
测试角色:Owner、运营专员、内部客户经理。
重点:登录、核心页面、任务、报告、权限边界、移动端基本体验。
只测试,不改代码。请输出测试报告。
交付前 UAT
你现在是挑剔客户视角的 AI 验收官。
请读取 docs/testing-agent/CODEX_TEST_AGENT_PROMPT.md。
本次阶段:交付前 UAT
测试目标:判断这个版本是否适合交给真实用户试用。
测试角色:Owner、新手用户、运营人员、内部管理员。
请输出:
1. Go / No-Go 结论
2. P0/P1/P2 问题清单
3. 角色体验观察
4. 业务风险
5. 下一步修复建议
修复后回归
请读取上一份测试报告。
只复测其中 P0/P1 问题。
不要扩大范围,除非发现新的 P0 风险。
请输出 Fixed / Partially Fixed / Still Open / Not Reproducible。
如何复制到新项目
- 把
docs/testing-agent/复制到目标项目的docs/testing-agent/。 - 为目标项目新增一份项目专属
PROJECT_TESTING.md或 UAT 清单。 - 把目标项目的角色写进
PERSONAS.md。 - 把目标项目的核心业务流程写进
SCENARIOS.md。 - 每次测试后,把报告放进
docs/testing-agent/reports/。 - 如果需要自动 smoke,把
scripts/sagemates-uat-smoke.example.mjs复制到目标项目并改接口地址、账号和断言。
smoke 脚本示例
已迁移脚本:scripts/sagemates-uat-smoke.example.mjs。
在具体项目中使用时,建议放到项目的 frontend/scripts/uat-smoke.mjs,并在 package.json 增加:
{
"scripts": {
"uat:smoke": "node scripts/uat-smoke.mjs"
}
}
运行:
npm run uat:smoke
监督规则
任何 Agent 声称完成,都必须有证据。没有命令、输出、截图、API 响应或报告,不得算完成。
- 开发 Agent 不能自签完成。
- 测试 Agent 默认不改业务代码。
- 审查 Agent 不替开发者补证据。
- 监督 Agent 只按证据放行。
- 涉及真实账号、真实广告、真实发布、真实外部写入时,默认 No-Go。
报告与样例
| 文件 | 说明 |
|---|---|
| UAT 4 测试报告 | 测试 Agent 交付报告样例。 |
| UAT 4 用户交接报告 | 交付给项目负责人的最终 UAT 包样例。 |
| 代码审查与漂移报告 | 检查代码、SOP、UAT 范围是否一致。 |
| 多 Agent 执行计划 | 如何拆分开发、测试、审查、监督和纠偏角色。 |
最小工作流
- 项目进入一个阶段,比如需求、开发中、交付前或修复后。
- 填写
TASK_CARD_TEMPLATE.md。 - 让测试 Agent 读取
CODEX_TEST_AGENT_PROMPT.md。 - 测试 Agent 按角色和场景执行测试。
- 报告输出到
docs/testing-agent/reports/。 - 开发 Agent 修复 P0/P1。
- 测试 Agent 只复测 P0/P1。
- 监督 Agent 检查证据,决定 Go / No-Go。