Z-Image ComfyUI Guide
S3-DiTアーキテクチャに基づく次世代オープンソース画像生成モデル。
6B パラメータ · 8ステップ高速推論 · フォトリアル画質
Z-Image-Turbo
推奨蒸留バージョン。速度とVRAM向けに最適化。
- わずか8ステップ推論
- < 16GB VRAM (コンシューマー向け)
- ネガティブプロンプト不要
Z-Image-Base
非蒸留の基本バージョン。コミュニティ開発の基盤。
- LoRA学習に最適
- コミュニティ微調整の第一選択
- Checkpoint公開済み
Z-Image-Edit
画像編集専用に微調整されたバージョン。
- 強力な指示追従能力
- 精密な局所編集
- 複雑な編集タスクに対応
インストールガイド
最新のComfyUIを使用してください。Hugging Faceからファイルをダウンロードし、以下の構造で配置します。
# Structure
ComfyUI/
├── models/
├── text_encoders/
└── qwen_3_4b.safetensors // テキストエンコーダー
├── diffusion_models/
└── z_image_turbo_bf16.safetensors // メインモデル (FP8/GGUF可)
├── vae/
└── ae.safetensors // Flux 1 VAE
├── model_patches/
└── Z-Image-Turbo-Fun-Controlnet-Union.safetensors // (任意) ControlNet
コアとなる利点
✓
中英バイリンガル: 中国語プロンプトをネイティブサポート。複雑なテキストレンダリング能力が非常に高い。
✓
無修正生成: Uncensored生成モードをサポートし、創作の自由度が高い。
✓
エコシステム互換: ControlNetとLoRA拡張を完全にサポート。
プロンプトのコツ
!
Turboモデルはネガティブプロンプト不要です。
!
照明用語を追加推奨:"volumetric lighting", "cinematic lighting"。
!
描写はできるだけ具体的に(シーン、ポーズ、材質)。