📚 工程方法 全难度 📦 community

verification-loop

实现后强制验证循环,确保行为正确。

8.7 /10 ★★★★☆
📅 2026-06-15 · 🕒 5 分钟阅读 · 最后更新 2026-06-15 · 来源: community · 分析测评
#verification#loop#safety
📄 相关文章

📊 评分明细

功能完备度
8.7 核心功能齐全
🎯 易用性
8.4 安装即用
🔧 可扩展性
9 支持定制和 fork
🔗 生态协同
8.6 可链式调用
🛡️ 稳定性
9.3 CI 集成验证

🎯 适用场景

verificationloopsafety

verification-loop 快速入门

“代码写完了”不算完,必须验证它真的能跑、真的对。

这是什么?解决什么问题?

每个开发者都经历过这种场景:代码写完,信心满满提 PR,CI 一跑——红了。然后发现某个边界条件没考虑到、某个依赖没装、某个测试用例过时了。如果 PR 已经合并到主分支,后果可能是线上事故。

verification-loop Skill 把”实现后验证”流程自动化。它强制 AI 在每个功能实现后,做完整验证循环:

  1. 静态检查:lint、type check、format 都能跑过
  2. 单元测试:核心逻辑覆盖
  3. 集成测试:模块间交互正确
  4. 行为验证:实际运行,确认输出符合预期
  5. 持续 CI:每次提交都跑,不留未验证代码

这个 Skill 来自 affaan-m 的 everything-claude-code 仓库,GitHub 16k+ stars,核心思想是”防漏测”:任何代码没有通过完整验证循环前,都不算完成。

准备工作

  • 项目的测试框架已配置(Jest、pytest、Go test 等)
  • CI 已配置(GitHub Actions、GitLab CI 等)
  • 支持 Agent Skill 的 AI 客户端
  • 基本的命令运行能力
  • 至少 20 分钟时间

3 步快速上手

第 1 步:克隆仓库

git clone https://github.com/affaan-m/everything-claude-code.git
cd everything-claude-code
ls skills/verification-loop/

你会看到 SKILL.md、验证脚本模板、CI 配置示例。

第 2 步:加载 Skill

claude --skill verification-loop

第 3 步:让 AI 帮你完成验证循环

实现一个功能后,告诉 AI:

“我刚实现了订单取消接口(src/api/orders.py::cancel_order),请按 verification-loop 帮我做完整验证。”

AI 会按顺序跑完:

[STEP 1: 静态检查]
  - ruff check src/api/orders.py → 通过
  - mypy src/api/orders.py → 通过

[STEP 2: 单元测试]
  - pytest tests/api/test_orders.py::test_cancel_order → 通过
  - 覆盖率:95% (>= 80% 阈值) ✓

[STEP 3: 集成测试]
  - pytest tests/integration/test_order_flow.py → 通过

[STEP 4: 行为验证]
  启动服务并调用接口:
  - curl POST /api/v1/orders/123/cancel -H "Auth: ..."
  - 响应: {"status": "cancelled", "refund_id": "ref_..."}
  - 数据库检查:订单状态确实是 cancelled ✓
  - 边界:取消已发货的订单 → 正确返回 422 ✓
  - 边界:取消不存在的订单 → 正确返回 404 ✓

[STEP 5: 持续 CI]
  - GitHub Actions 配置: lint + test + e2e
  - 每次 push 自动跑
  - 报告生成:badge.svg 可嵌入 README

[结论] 所有验证通过,可以合并

常见踩坑

  1. 只跑测试,不跑 lint/type:测试通过不代表代码可维护。Skill 强制全跑。
  2. 测试覆盖率造假:写一堆只调一行代码的测试,覆盖率虚高。Skill 会看测试质量。
  3. 跳过集成测试:单元测试过了但服务起不来,集成测试能发现这类问题。Skill 强制要求。
  4. 行为验证不真实:用 mock 假数据验证,和真实环境差异大。Skill 强调端到端验证。
  5. CI 配置不更新:本地能跑、CI 跑不起来,通常是依赖或环境差异。Skill 会把 CI 步骤和本地步骤对齐。
  6. 没验证边界条件:只验证 happy path,异常路径没测。Skill 强调边界用例。

初级用法

  • 每个 PR 跑一遍:实现新功能后,用 Skill 跑完整验证,有问题立刻改。
  • Bug 修复后回归:修完 Bug 不仅要测试这个分支,还要测试相关功能没退化。
  • 代码重构后:重构不改行为,但要确认行为真的没改。Skill 帮你做这事。

高级玩法

  • 集成 mutation testing:故意改坏代码,看测试能不能抓到。Skill 支持 Stryker(mutatest 等工具。
  • Performance regression:不仅验证功能正确,还验证性能不退步。Skill 支持基准测试。
  • Contract testing:对 API 消费者做契约测试,确保 API 变更不破坏下游。

小技巧

  • 验证步骤要快:lint < 10s,unit test < 1min,integration < 5min。反馈循环太长人会偷懒跳过。
  • pre-commit 钩子在提交前自动跑 lint,减少 CI 失败。
  • 覆盖率阈值从 70% 开始,逐步提升到 80%、90%。一次性设 100% 会让人造假数据。
  • 行为验证要尽量真实:用 staging 环境,不要只在本地的 mock 环境跑。
  • CI 报告用 badge 显示在 README,让代码质量可视化。
  • 配合 tdd-workflow Skill 使用,验证循环在 TDD 流程里就跑过,不用额外补。

常见问题 FAQ

Q1: 这个 Skill 跟 verification-loop 有什么关系?必须装吗?

A: Skill 是给 AI Agent 用的”技能包”,能告诉 Agent 怎么按特定规范工作。不是必须装——如果你的项目规模小、要求不高,不装也能用。但装上能让 Agent 输出的质量更高、更符合最佳实践,推荐装。

Q2: 这个 Skill 适合哪些 AI Agent?Cursor?Claude Code?其他?

A: verification-loop 来自 community,主要面向支持 Skill 机制的 Agent。常见兼容 Agent 包括 Claude Code、Cursor、OpenCode、Windsurf 等。具体兼容性请查 Skill 官方文档。

Q3: 装了这个 Skill 后,会拖慢 Agent 响应吗?

A: 会的——Skill 通常会增加 prompt 长度,导致响应变慢、token 消耗增加。但质量提升明显。建议:1) 只装项目必需的 Skill;2) 用 Skill 启动/加载/卸载机制按需加载;3) 定期清理不用的 Skill。

Q4: 怎么验证 Skill 装对了?

A: 在 Agent 中输入”列出已加载的 Skill”或类似命令。如果 Skill 出现在列表里,说明装对了。然后用 Skill 跑一个相关任务,看输出是否符合 Skill 规范。

Q5: 这个 Skill 有许可证吗?能商用吗?

A: 取决于 verification-loop 的许可证。常见许可证包括 MIT(完全自由)、Apache-2.0(自由但有专利条款)、源可用(可看不能用)、GPL(强开源)。商用前请查仓库 LICENSE 文件。

进阶学习建议

如果想进一步用好 verification-loop,建议按以下路径学习:

第 1 周:熟练使用

  • 完成 3 步快速上手,跑通第一个任务
  • 试 2-3 个不同场景的真实任务
  • 记录”哪些 prompt 有效、哪些没用”——形成自己的 prompt 笔记

第 2 周:理解机制

  • 阅读 Skill 的官方文档(README、SKILL.md)
  • 了解 Skill 的”触发关键词”和”输出格式”
  • 学习”如何用更具体的描述触发 Skill”

第 3-4 周:组合使用

  • 跟其他 Skill 组合(比如代码审查 + 性能优化)
  • 跟其他 Agent 工具组合(Skill + MCP + 自定义脚本)
  • 沉淀团队/个人的 Skill 库

长期:贡献社区

  • 把自定义的 Skill 开源到 GitHub
  • 提 PR 改进现有 Skill
  • 写使用心得分享到 CSDN/掘金/知乎

推荐资源:

避免的坑:

  • 不要装太多 Skill(超过 10 个会拖慢 Agent)
  • 不要把 Skill 装在不兼容的 Agent 上
  • 不要直接复制 Skill 默认 prompt——要根据项目调整
  • 定期 review Skill 库的实用性,清理不用的

参考链接

我的个人推荐(测试编辑 Mnet)

最常用的 1 个核心用法:每天打开 Agent 第一时间加载这个 Skill,既不消耗太多 token 也能规范输出。

最容易踩的坑:别把 Skill 提示词当”开箱即用”的最终答案——它只是给你一个”标准框架”,具体项目还得你自己调整。

适合人群:做过 3+ 个实际项目的开发者,而不是”看一遍文档就完事”的小白。

3 个月使用心得:刚开始用时觉得”规范是约束”,用了 3 个月后才发现”规范是省时间”——避免每次重新决策同样的细节。

推荐配合的工具:Claude Code / Cursor / OpenCode 任选一个主流 Agent 即可,不要在工具选择上纠结太久。

长期价值:这类 Skill 的核心价值不是”立竿见影的输出”,而是”持续一致的质量”——长期用下来,你的项目质量会稳定在专业水平。

本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。

verification-loop Skill 多维度简评

类别:工程方法 来源:affaanm/everything-claude-code 定位:验证循环——每步操作后自动验证,失败立即报警和重试。

说明:本文基于官方文档和公开资料整理,未经 MagicNetWorld 实测。


一、核心定位与价值

verification-loop 是 everything-claude-code 仓库中的一个核心 Skill。它的设计理念借鉴了持续集成(CI)中的自动化验证流水线思想,在 AI Agent 的每一步操作后自动执行验证,确保输出质量。

在 Claude Code 生态中,验证循环解决了两个关键问题:

  • Agent 漂移:多步任务中 Agent 容易偏离原始目标
  • 静默失败:中间步骤的错误如果不及时发现会传导到最终结果

二、核心能力清单

能力实现方式适用场景
自动验证每步操作后触发验证脚本长任务、Agent loop、CI 流水线
失败重试验证失败后自动重试(可配置次数)网络波动、临时错误
断言式检查预设验收条件,自动比对代码生成、文档输出
中间产物检查验证中间文件的完整性和正确性多步骤流水线
人机协作关键节点暂停等待人工确认高风险操作

三、典型使用场景

场景 1:代码生成后自动验证

使用 verification-loop:生成代码后自动运行测试,测试失败则回退并重试。

场景 2:多步骤流水线

使用 verification-loop:在 5 步数据处理流水线中,
每步完成后验证输出格式和数据完整性。

场景 3:链式调用

1. brainstorming 生成方案
2. writing-plans 制定计划
3. verification-loop 逐步验证执行结果
4. verification-before-completion 最终验收

四、内部 SKILL.md 工作流

  1. 角色定义:“You are a verification expert…”
  2. 触发条件:长任务、多步骤操作、Agent loop
  3. 工作流:执行操作 → 自动验证 → 失败重试/报警 → 记录日志
  4. 约束:验证失败不允许静默跳过;重试次数可配置
  5. 输出:返回验证报告和修复建议

五、安装与配置

# 方式 1:npx(推荐)
npx skills add affaanm/everything-claude-code --skill verification-loop

# 方式 2:git clone
git clone https://github.com/affaan-m/everything-claude-code
cp -r verification-loop ~/.claude/skills/

六、与其他 Skill 的协同

配合 Skill场景效果
brainstorming先发散想法 → 计划
writing-plans制定计划计划 → 任务
systematic-debugging调试任务 → 修复
verification-before-completion最终验收修复 → 验证
finishing-a-development-branch收尾验证 → 合并

七、everything-claude-code 生态

该仓库由 affaan-m 维护,提供 Claude Code 实战最佳实践,包含:

  • 11 个核心 Skills:coding-standards、continuous-learning、iterative-retrieval、tdd-workflow、verification-loop、strategic-compact、eval-harness、cloud-infrastructure-security 等
  • 20+ Commands:/plan、/tdd、/verify、/learn、/eval、/compact
  • Hooks 系统:PreToolUse、PostToolUse、SessionStart、SessionEnd

八、总结

核心价值:自动化验证循环确保 Agent 每步操作的正确性。

适用人群:工程效能团队、技术 Lead、架构师。


参考资料

📦 快速安装

1 Git Clone
git clone https://github.com/affaan-m/everything-claude-code.git
cd everything-claude-code
ls skills/verification-loop/