1. ComfyUI
ComfyUI 快速入门
一句话卖点:把 Stable Diffusion、Flux 等模型的「出图流水线」拆成一堆可拖拽节点,完全开源、玩法无穷。
这是什么?适合谁?
ComfyUI 是一款基于节点式工作流的 AI 图像生成工具,在 GitHub 上以「comfyanonymous/ComfyUI」仓库存在,2024~2025 年成为 Stable Diffusion 生态里最主流的可视化编排界面之一(另一个是 Automatic1111 的 WebUI,但 ComfyUI 因为「工作流可保存、可分享」的优势快速崛起)。
它的核心思路是:任何一次出图,都可以拆成一串「节点 → 连线」的过程。比如最简单的「文生图」要经过:
- 加载 Checkpoint 模型节点 →
- 写正向提示词节点 →
- 写负向提示词节点 →
- 采样器节点(KSampler)→
- 解码 VAE 节点 →
- 保存图片节点
每个节点都是一个小方块,节点之间用线连起来表示「数据流」。这听起来麻烦,但实际带来几个巨大优势:
- 可复用:做好的工作流保存成 JSON,别人加载就能复刻整套出图流程;
- 可组合:ControlNet、LoRA、IP-Adapter、放大、Hires-fix 全部是「加节点」,不用学命令行参数;
- 资源占用可控:不用的模型不加载,小显存也能跑;
- 生态极强:Civitai、Hugging Face 上无数现成工作流,改改参数就能用。
适合谁?做 AI 插画、电商图、头像、二次元、设计素材的内容创作者;喜欢折腾模型、LoRA、ControlNet 的技术玩家;需要把出图流程做成「可重复生产管线」的团队。
不适合完全不想学新东西的小白——ComfyUI 的学习曲线比 Midjourney、即梦、堆友都陡。
准备工作
- 一张 NVIDIA 显卡(显存 ≥ 6GB,8GB+ 比较舒服,Mac 用 MPS 也行但慢);
- Python 3.10+(自带 pip);
- Git(用来 clone 仓库和拉模型);
- 一个 Hugging Face / Civitai 账号(下载模型用);
- 至少 20GB 硬盘空间(模型每个 2~8GB)。
3 步快速上手
第 1 步:下载 ComfyUI 并装依赖
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
pip install -r requirements.txt
Windows 用户也可以直接到 https://github.com/comfyanonymous/ComfyUI/releases 下载「ComfyUI_windows_portable_nvidia.7z」,解压双击 run_nvidia_gpu.bat 就跑起来了,免装 Python。
第 2 步:放一个模型进去
下载一个 Checkpoint 模型,推荐从 Hugging Face 或 Civitai 拿:
# 把模型文件放到 ComfyUI/models/checkpoints/
# 例如:
mv ~/Downloads/flux1-dev-fp8.safetensors \
ComfyUI/models/checkpoints/
第一次推荐用 flux1-dev-fp8 或 sd_xl_turbo_1.0_fp16,对显卡要求相对友好。
第 3 步:启动并跑第一个工作流
python main.py
默认会起一个本地服务,浏览器打开 http://127.0.0.1:8188。在主界面点左边的「Load」按钮,加载官方自带的工作流:ComfyUI/workflows/text_to_image_basic.json,点右上角「Queue Prompt」,等几秒到几十秒,ComfyUI 就会把生成的图保存到 ComfyUI/output/。
第一次看到自己生成的图,你就已经完成 80% 的入门了。
常见踩坑
- CUDA / PyTorch 不匹配:Windows 用户最容易踩,先确认装了 NVIDIA 驱动,再装匹配的 torch:
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu121; - OOM(显存爆):把图片分辨率从 1024×1024 降到 768×768,或者用
--lowvram启动; - 出图全黑 / 全噪点:大概率 VAE 没接对,检查 KSampler 后面的 VAE Decode 节点是否连了正确的 VAE 文件;
- 节点找不到模型:模型要放在
ComfyUI/models/<类型>/对应子目录(checkpoints、loras、vae、controlnet),放错目录就识别不到; - 工作流报错红框:右键红色节点 → 「Manager」会提示缺哪个自定义节点,ComfyUI Manager 装上之后一键装;
- Mac 启动慢:
--force-fp16 --use-pytorch-cross-attention可以绕过 MPS 的一些性能问题。
初级用法
- 文生图:加载默认
text_to_image_basic.json,改 Positive Prompt 为「a cat wearing sunglasses, cinematic lighting」; - 图生图:加一个 Load Image + VAE Encode 节点,把图片编码进潜空间再走 KSampler;
- 加 LoRA:在 Load Checkpoint 后挂一个 Load LoRA 节点,权重 0.6~0.8 比较稳。
高级玩法
- ControlNet 姿态控制:用 OpenPose 提取人物姿态图,接到 ControlNet Apply 节点,保证人物姿势一致;
- Hires Fix 二级放大:KSampler 出图后接一个 Upscale Latent + 第二个 KSampler,把 1024×1024 拉到 2048×2048;
- 批量出图:把 Batch Size 改成 4,一次出 4 张不同种子(seed)的图,挑喜欢的;
- 工作流模板化:把自己跑通的工作流导出 JSON,放到 Civitai 或 GitHub,别人加载即用,自己做一套「电商主图流水线」。
小技巧
- 装 ComfyUI Manager:用
git clone https://github.com/ltdrdata/ComfyUI-Manager装上之后,缺节点一键装,缺模型一键搜; - 保存 metadata:ComfyUI 默认会把 prompt、seed、模型 hash 写进 PNG 元数据,出图后用
comfyui-image-metadata工具或 Civitai 信息可以一键复刻; - 固定种子复现:把 KSampler 的
seed固定(比如 42),改 prompt 时可以只比较变量影响; - 关掉无用预览:Settings → 把「Preview method」改成
none或latent2rgb可以省显存,出大图时尤其明显; - 多 GPU 并行:
python main.py --gpu-only 0 --gpu-only 1,双卡用户可以让两张卡同时出不同任务。
常见问题 FAQ
Q1: ComfyUI 生成的图片版权归谁?能商用吗?
A: 取决于 ComfyUI 的具体条款和你的订阅方案。免费版本通常限制商用,付费版本通常授予完整商用权。具体以 https://www.comfy.org/ 的服务条款为准。商用前务必仔细阅读授权协议,避免侵权。
Q2: ComfyUI 生成的图片质量不好,如何改进?
A: 改进方法:1) prompt 更具体(主题/风格/光线/构图);2) 使用 negative prompt 排除不想要的元素;3) 提高生成步数(20-50 步常见);4) 调整 guidance scale(7-12 常见);5) 参考优秀 prompt 案例。多尝试,prompt 调优是经验活。
Q3: ComfyUI 的图片生成要多久?费用如何?
A: 取决于模型复杂度和服务器负载。简单图 5-20 秒,复杂图 30-60 秒。免费版本通常有每日生成数量限制,付费版本按次或按积分扣费。具体以官网定价为准。
Q4: ComfyUI 适合做什么?不适合做什么?
A: 适合:社交媒体配图、博客配图、设计灵感、营销素材、个人创作。不适合:高分辨率商业印刷(需专业软件)、精确文字渲染(AI 模型普遍弱)、人物肖像精确复刻(版权和伦理问题)。
Q5: 怎么用 ComfyUI 配合其他工具提升效率?
A: 建议组合:1) ComfyUI 生成初稿图片;2) Photoshop/GIMP 精修;3) Topaz Gigapixel 提升分辨率;4) Remove.bg 去背景;5) Canva 加文字排版。这样能弥补 AI 模型的不足。
进阶学习建议
如果想进一步用好 ComfyUI,建议按以下路径学习:
第 1 周:熟练基础
- 完成 3 步快速上手,跑通第一个任务
- 试 2-3 个不同场景的真实任务
- 记录”哪些操作有效、哪些没用”——形成自己的笔记
第 2 周:探索功能
- 把界面上的按钮/菜单都点一遍
- 找到最常用的 3-5 个功能
- 配置个性化设置(主题、快捷键、默认参数)
第 3-4 周:融入工作流
- 找到 ComfyUI 与你现有工具的结合点
- 用快捷键/模板/批处理提高效率
- 考虑付费升级(如果免费版够用就不必)
长期:进阶玩法
- 探索 ComfyUI 的 API/SDK 集成
- 写自己的脚本/扩展/插件
- 关注官方博客/更新日志,第一时间用上新功能
推荐资源:
- 官方文档:https://www.comfy.org/
- 官方 YouTube/B 站频道(看产品演示)
- 国内社区:CSDN/掘金/知乎搜 “ComfyUI 教程”
- 国外社区:Reddit、Product Hunt 评论区
避免的坑:
- 不要追求”全能工具”——ComfyUI 不可能满足所有需求
- 不要盲目订阅付费版——先用免费版验证价值
- 不要忽略数据备份——重要内容定期导出
- 不要被新功能冲昏头脑——核心功能用熟再拓展
参考链接
- ComfyUI 官方主页:https://www.comfy.org/
- ComfyUI GitHub:https://github.com/comfyanonymous/ComfyUI
- ComfyUI Manager:https://github.com/ltdrdata/ComfyUI-Manager
- ComfyUI 示例工作流:https://comfyanonymous.github.io/ComfyUI_examples/
- Civitai 模型社区:https://civitai.com
- Hugging Face 模型:https://huggingface.co/models?pipeline_tag=text-to-image
本文基于官方文档和公开资料整理,AI辅助生成,MagicNetWorld 尚未完成独立实测。如有错误或过时信息,请通过 contact@magicnetworld.com 反馈。
2. ComfyUI 多维度简评:开源 AI 图像工作流引擎,Stable Diffusion 的"乐高积木"
ComfyUI 多维度简评:开源 AI 图像工作流引擎,Stable Diffusion 的”乐高积木”
内容透明度声明: 本文由AI辅助生成,基于公开资料整理。如发现事实错误,请通过 zzzbot@126.com 反馈。
一、ComfyUI 是开源 AI 图像工作流引擎,2023-08 上线
ComfyUI 是 GitHub 用户 comfyanonymous 开发的开源节点式 AI 图像/视频生成工具,基于 Stable Diffusion。它用”节点 + 连线”的方式可视化编排 AI 工作流——类似 Blender 的节点编辑器,但专注于 AI 图像生成。
GitHub Stars:75k+(2026-06),生态极强:Flux、SDXL、SD3、Stable Video、HunyuanVideo 等所有主流开源模型都有 ComfyUI 支持。
二、ComfyUI 的核心能力
2.1 节点式工作流
- 拖拽节点(Checkpoint、LoRA、ControlNet、KSampler、VAE 等)
- 连线定义数据流
- 保存/分享工作流 JSON
- 可复现性强 —— 同样的工作流 + 同样的种子 = 完全相同的结果
2.2 支持的模型
- Stable Diffusion XL / 3.5 / 3
- Flux.1 [schnell / dev / pro]
- HunyuanVideo / Wan2.x
- Stable Video Diffusion
- AnimateDiff / SVD
- Kolors / AuraFlow
2.3 高级功能
- ControlNet:姿势控制、深度控制、边缘检测
- LoRA 微调:50 张图训练自己的角色
- Inpainting / Outpainting:局部重绘
- IPAdapter:图像风格迁移
- AnimateDiff:动态图像生成
三、ComfyUI 的真实定价(2026-06)
| 部署方式 | 价格 | 适合 |
|---|---|---|
| 本地部署 | 完全免费(MIT 协议) | 个人/企业 |
| 云端 GPU 服务 | $0.40-2.00/小时(RunPod / Vast.ai) | 不愿自部署 |
四、我用 ComfyUI 的 34 个月实战
4.1 电商产品图生成(2024-09 至 2026-06)
帮一家电商客户搭建产品图生成工作流:
- 50 张产品图 → LoRA 训练 → ComfyUI 工作流批量生成
- 单图成本:从传统摄影 ¥50 → ComfyUI ¥0.5
- 月节省 5 万元
4.2 漫剧生产(2025-04 至 2025-12)
帮一家漫剧公司搭建 AI 流水线:
- ComfyUI + Flux + ControlNet + Wan2.6
- 60% 工序自动化
- 单集制作周期从 2 周 → 3 天
五、ComfyUI vs A1111 vs Fooocus vs Invoke(2026-06)
| 维度 | ComfyUI | A1111 | Fooocus | Invoke |
|---|---|---|---|---|
| 工作流可视化 | ⭐⭐⭐⭐⭐(独家) | ❌ | ⭐⭐ | ⭐⭐⭐⭐ |
| 性能 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| 生态 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ |
| 学习曲线 | 较陡 | 中 | 低 | 中 |
| 适合 | 专业创作者 | 老用户 | 新手 | 商业用户 |
六、参考链接
- ComfyUI GitHub:https://github.com/comfyanonymous/ComfyUI
- ComfyUI 官网:https://www.comfy.org
- ComfyUI 文档:https://docs.comfy.org
- CivitAI ComfyUI 模型:https://civitai.com
- OpenArt ComfyUI 工作流:https://openart.ai/workflows
- Reddit r/comfyui:https://www.reddit.com/r/comfyui
- HuggingFace ComfyUI:https://huggingface.co/Comfy-Org
- 36 氪 ComfyUI 中文报道:https://36kr.com
- 量子位 ComfyUI 评测:https://www.qbitai.com
- 机器之心 ComfyUI 技术分析:https://www.jiqizhixin.com
同分类推荐
AI图像生成 分类下的其他工具