vector-database
向量数据库专项(Milvus/Pinecone/Qdrant/Chroma)。
评分明细
适用场景
vector-database 快速入门
选向量数据库不再纠结——这个 Skill 让 AI 助手 3 步帮你挑出最合适的 Milvus / Pinecone / Qdrant / Chroma 方案。
这是什么?解决什么问题?
vector-database 是 Anthropic 在 anthropics/skills 生态下沉淀的 AI/ML 专项 Skill,专注于向量数据库的选型、Embedding 模型搭配、索引调优和 RAG(检索增强生成)落地。
向量数据库是当下 AI 应用绕不开的基础设施——RAG、推荐系统、语义搜索、AI Agent 的长记忆,背后几乎都跑着某种 ANN(Approximate Nearest Neighbor)索引。但选哪种数据库、怎么调参、如何做混合检索,新手往往一头雾水。常见疑问包括:
- Milvus / Pinecone / Qdrant / Chroma 我该选哪个?
- HNSW、IVF、PQ、DiskANN 这些索引该怎么配?
- Embedding 模型维度跟数据库要不要对齐?
- 怎么混合检索(向量 + 关键词)?
- 千万级、亿级、十亿级数据量时架构差异在哪?
这个 Skill 把上述问题整理成结构化提示词,让 Claude Code、Cursor 等 Agent 在你提出需求时,主动追问规模、延迟、运维能力等关键约束,然后给出对比表与推荐配置。
适合做 AI 应用开发的工程师、AI 产品经理、做技术选型的架构师,以及刚开始接触 RAG 想要少走弯路的小白。
准备工作
- AI 编程 Agent:Claude Code、Cursor 或 Cline,推荐 Claude Code,体验最完整。
- Python ≥ 3.10:本 Skill 示例代码基于 Python,可用
pyenv或系统自带版本。 - Docker(可选):本机跑 Milvus / Qdrant 推荐用 Docker。
- 一个示例文本语料:哪怕几十条产品说明或 FAQ 都能拿来练手。
- OpenAI / Claude / HuggingFace 任意一种 Embedding 接口:Skill 会提示 Agent 根据你的预算和隐私需求帮你选型。
3 步快速上手
第 1 步:把 Skill 加载到 Agent
克隆 Anthropic 官方 Skills 仓库:
git clone https://github.com/anthropics/skills.git
cd skills/skills/vector-database
ls
在项目根目录新建 CLAUDE.md:
# CLAUDE.md
When I ask for vector database recommendations or RAG design, read
anthropics/skills/skills/vector-database/SKILL.md first and follow its
decision tree.
第 2 步:确认 Agent 加载成功
随便问一句:
请告诉我 vector-database Skill 包含哪几个对比维度?它对 Milvus / Pinecone / Qdrant / Chroma 的总结是什么?
如果 Agent 给出包含运维成本、扩展性、生态、托管/自托管等维度的回答,说明加载成功。
第 3 步:用 Skill 跑第一次选型
举一个真实场景:
我在做公司内部的法务知识库,大概 50 万条合同片段,需要做 RAG 问答,延迟 500ms 以内,预算有限,只有 1 个后端工程师。请问应该用哪个向量数据库?请用 vector-database Skill 给我选型。
Agent 会按 Skill 的决策树反问你:
- 数据规模?
- 延迟要求?
- 私有部署还是托管?
- 团队运维能力?
- 是否需要混合检索?
回答之后,Agent 通常会给出 Chroma(本地原型)→ Qdrant(单机)→ Milvus(分布式) 的渐进路线,并附带具体配置示例、Embedding 选型、索引参数初值。
常见踩坑
- 上来就用 Pinecone:托管服务虽然省心,但一旦数据量上去或数据出域,迁移成本极高。Skill 会推荐先用开源方案做 PoC。
- Embedding 维度不匹配库:1536 维、768 维、1024 维混用会让召回率暴跌。Skill 提示你统一 Embedding。
- 忽略混合检索:纯向量召回对专有名词、缩写、版本号效果差,Skill 推荐 BM25 + 向量的混合方案。
- 索引参数照搬博客:HNSW 的
efConstruction、M这些参数没有“通用最佳值”,Skill 会要求 Agent 根据数据集实际调优。 - 不做单元测试就跑全量入库:百万级数据如果中途失败,排查很费劲,Skill 提示先做 1% 子集验证。
- 冷启动数据为空时硬调相似度阈值:相似度阈值要根据真实数据分布设定,Skill 推荐用
score > 0.78之类时务必先看分布。
初级用法
1. 快速搭个 Chroma Demo
用 Chroma + sentence-transformers 给我写一个 50 条 FAQ 的语义搜索 demo。
Agent 会按 Skill 模板给你一段 30 行内的 Python 代码。
2. 切换 Embedding 模型
我现在用
text-embedding-3-small想换成开源的bge-m3,向量库要不要重建?
Skill 会告诉 Agent:维度从 1536 变 1024,必须重建,而不是直接插入。
3. 索引参数起步模板
让 Agent 输出 HNSW / IVF 起步参数表,这是新手最常卡的地方。
高级玩法
1. 混合检索流水线
results = bm25.search(query) | vector_store.search(embedding, top_k=20)
final = reranker.rerank(query, results, top_k=5)
Skill 提示 Agent 必须有 rerank 步骤,否则向量召回的精度会不够。
2. 跨库迁移演练
Skill 包含一段从 Chroma → Qdrant → Milvus 的渐进迁移清单,适合在数据量增长时使用。
3. 监控指标面板
让 Agent 用 Prometheus + Grafana 监控:
qpsp99_latency_secondsrecall_at_10(用留置评测集测)index_size_bytes
小技巧
- 用
numpy直接做小规模相似度:1000 条以内直接cosine_similarity就行,别上 ANN 库。 - 元数据过滤要走数据库原生 DSL:别在 Python 里
for循环过滤,慢几十倍。 - 给向量字段加 HASH 索引:对需要按 ID 精确查询时有用。
- 定期做 recall 评测:别只看 latency,精度掉到 0.85 以下用户就会觉得 AI “答非所问”。
- 分片策略看 QPS 而不是数据量:1 亿条小向量单机能扛,但 1 亿条 + 高 QPS 必须分片。
常见问题 FAQ
Q1: 这个 Skill 跟 vector-database 有什么关系?必须装吗?
A: Skill 是给 AI Agent 用的”技能包”,能告诉 Agent 怎么按特定规范工作。不是必须装——如果你的项目规模小、要求不高,不装也能用。但装上能让 Agent 输出的质量更高、更符合最佳实践,推荐装。
Q2: 这个 Skill 适合哪些 AI Agent?Cursor?Claude Code?其他?
A: vector-database 来自 Anthropic,主要面向支持 Skill 机制的 Agent。常见兼容 Agent 包括 Claude Code、Cursor、OpenCode、Windsurf 等。具体兼容性请查 Skill 官方文档。
Q3: 装了这个 Skill 后,会拖慢 Agent 响应吗?
A: 会的——Skill 通常会增加 prompt 长度,导致响应变慢、token 消耗增加。但质量提升明显。建议:1) 只装项目必需的 Skill;2) 用 Skill 启动/加载/卸载机制按需加载;3) 定期清理不用的 Skill。
Q4: 怎么验证 Skill 装对了?
A: 在 Agent 中输入”列出已加载的 Skill”或类似命令。如果 Skill 出现在列表里,说明装对了。然后用 Skill 跑一个相关任务,看输出是否符合 Skill 规范。
Q5: 这个 Skill 有许可证吗?能商用吗?
A: 取决于 vector-database 的许可证。常见许可证包括 MIT(完全自由)、Apache-2.0(自由但有专利条款)、源可用(可看不能用)、GPL(强开源)。商用前请查仓库 LICENSE 文件。
进阶学习建议
如果想进一步用好 vector-database,建议按以下路径学习:
第 1 周:熟练使用
- 完成 3 步快速上手,跑通第一个任务
- 试 2-3 个不同场景的真实任务
- 记录”哪些 prompt 有效、哪些没用”——形成自己的 prompt 笔记
第 2 周:理解机制
- 阅读 Skill 的官方文档(README、SKILL.md)
- 了解 Skill 的”触发关键词”和”输出格式”
- 学习”如何用更具体的描述触发 Skill”
第 3-4 周:组合使用
- 跟其他 Skill 组合(比如代码审查 + 性能优化)
- 跟其他 Agent 工具组合(Skill + MCP + 自定义脚本)
- 沉淀团队/个人的 Skill 库
长期:贡献社区
- 把自定义的 Skill 开源到 GitHub
- 提 PR 改进现有 Skill
- 写使用心得分享到 CSDN/掘金/知乎
推荐资源:
- 官方文档:https://github.com/JackyST0/awesome-agent-skills
- 官方仓库 README 里的 Examples
- 社区最佳实践:Anthropic 官方博客 https://www.anthropic.com/blog
- 国内社区:CSDN AI 板块、掘金 AI 板块
避免的坑:
- 不要装太多 Skill(超过 10 个会拖慢 Agent)
- 不要把 Skill 装在不兼容的 Agent 上
- 不要直接复制 Skill 默认 prompt——要根据项目调整
- 定期 review Skill 库的实用性,清理不用的
参考链接
- Anthropic Skills 总仓库:https://github.com/anthropics/skills
- vector-database 子目录:https://github.com/anthropics/skills/tree/main/skills/vector-database
- Milvus 官方文档:https://milvus.io/docs
- Pinecone 文档:https://docs.pinecone.io/
- Qdrant 文档:https://qdrant.tech/documentation/
- Chroma 文档:https://docs.trychroma.com/
- Sentence-Transformers:https://www.sbert.net/
- BGE Embedding:https://huggingface.co/BAAI/bge-m3
本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。
vector-database Skill 多维度简评
类别:开发工具 来源:anthropics/skills 定位:向量数据库集成,覆盖 Pinecone、Qdrant、Weaviate、Chroma、pgvector。
说明:本文基于官方文档和公开资料整理,未经 MagicNetWorld 实测。
一、核心定位与价值
vector-database 是 Anthropic 官方 Skills 仓库中面向 RAG(检索增强生成)基础设施的 Skill。它帮助开发者在 Claude Code 中快速集成主流向量数据库,用于语义搜索、推荐系统和 AI 应用的数据检索层。
根据 2025 年向量数据库市场对比数据,主流选择包括:
| 数据库 | 类型 | 优势 |
|---|---|---|
| Pinecone | 全托管云服务 | 5 行代码启动,p95 延迟 <50ms,免费层 100K 向量 |
| Qdrant | 开源(Rust 实现) | 最快性能,量化支持(4x 内存缩减),过滤能力强 |
| Weaviate | 开源 + 托管 | GraphQL API,内置向量化(OpenAI/Cohere),混合搜索 |
| Chroma | 开源 | 轻量级,适合本地开发和原型验证 |
| pgvector | PostgreSQL 扩展 | 与现有 PG 生态无缝集成 |
二、核心能力清单
| 能力 | 实现方式 | 适用场景 |
|---|---|---|
| Pinecone 集成 | 自动化脚本 | RAG、语义搜索、推荐系统 |
| Qdrant 集成 | 自动化脚本 | 性能敏感场景、实时搜索 |
| Weaviate 集成 | 自动化脚本 | 复杂过滤、多租户应用 |
| Chroma 集成 | 自动化脚本 | 本地原型、轻量级部署 |
| pgvector 集成 | 自动化脚本 | PostgreSQL 用户、中小规模 |
三、典型使用场景
场景 1:搭建 RAG 知识库
使用 vector-database skill,用 Pinecone 创建索引,将项目文档向量化后存入,
支持语义搜索问答。
场景 2:语义搜索
使用 vector-database skill,基于 Qdrant 构建语义搜索引擎,
对用户查询返回最相关的文档片段。
场景 3:链式调用
1. 用 brainstorming 规划方案
2. 用 vector-database 搭建向量检索层
3. 用 verification-before-completion 验证检索质量
四、内部 SKILL.md 工作流
vector-database Skill 遵循 Agent Skills 规范,SKILL.md 包含:
- 角色定义:“You are a vector database expert…”
- 触发条件:涉及向量存储、语义搜索、RAG 等关键词
- 工作流:识别数据库类型 → 调用对应脚本 → 输出结构化结果
- 约束:始终使用推荐索引参数、验证连接状态
- 输出:返回具体可执行的集成代码或配置
五、安装与配置
# Claude Code
npx skills add anthropics/skills --skill vector-database
# 或通过 Git
git clone https://github.com/anthropics/skills
cp -r skills/vector-database ~/.claude/skills/
在 CLAUDE.md 中启用:
skills:
- vector-database
六、性能参考
| 场景 | 参考耗时 | 建议 |
|---|---|---|
| 创建索引(1K-10K 向量) | < 5s | 一次性操作 |
| 向量插入(1K 条) | 1-5s | 建议批量 upsert |
| 语义查询 | 10-100ms | 取决于索引类型和维度 |
七、常见 Q&A
Q:和原生 Claude 提示词区别? A:原生 LLM 负责对话理解,Skill 包含具体脚本和模板,可直接执行数据库操作。
Q:能离线用吗? A:本地 Chroma/pgvector 可完全离线。云服务(Pinecone/Qdrant Cloud)需要网络连接。
Q:开源协议? A:Apache-2.0,可商用和修改。
八、总结
核心价值:一站式集成主流向量数据库,覆盖 RAG 全流程。
适用人群:AI 应用开发者、RAG 系统构建者、后端工程师。
参考资料
- Anthropic Skills 官方仓库 — GitHub
- Agent Skills 开放规范 — 官方网站
- Vector Database Comparison 2025: Pinecone vs Weaviate vs Qdrant vs Milvus — 技术文章
- Vector Database Benchmarks 2025 — 性能基准测试
- Pinecone 官方文档 — 官方文档
- Qdrant 官方文档 — 官方文档
快速安装
git clone https://github.com/anthropics/skills.git
cd skills/skills/vector-database
ls