Z-Image ComfyUI Guide

S3-DiTアーキテクチャに基づく次世代オープンソース画像生成モデル。
6B パラメータ · 8ステップ高速推論 · フォトリアル画質

Z-Image-Turbo

推奨

蒸留バージョン。速度とVRAM向けに最適化。

  • わずか8ステップ推論
  • < 16GB VRAM (コンシューマー向け)
  • ネガティブプロンプト不要

Z-Image-Base

非蒸留の基本バージョン。コミュニティ開発の基盤。

  • LoRA学習に最適
  • コミュニティ微調整の第一選択
  • Checkpoint公開済み

Z-Image-Edit

画像編集専用に微調整されたバージョン。

  • 強力な指示追従能力
  • 精密な局所編集
  • 複雑な編集タスクに対応

インストールガイド

最新のComfyUIを使用してください。Hugging Faceからファイルをダウンロードし、以下の構造で配置します。

# Structure
ComfyUI/
├── models/
├── text_encoders/
└── qwen_3_4b.safetensors // テキストエンコーダー
├── diffusion_models/
└── z_image_turbo_bf16.safetensors // メインモデル (FP8/GGUF可)
├── vae/
└── ae.safetensors // Flux 1 VAE
├── model_patches/
└── Z-Image-Turbo-Fun-Controlnet-Union.safetensors // (任意) ControlNet

コアとなる利点

中英バイリンガル: 中国語プロンプトをネイティブサポート。複雑なテキストレンダリング能力が非常に高い。

無修正生成: Uncensored生成モードをサポートし、創作の自由度が高い。

エコシステム互換: ControlNetとLoRA拡張を完全にサポート。

プロンプトのコツ

!

Turboモデルはネガティブプロンプト不要です。

!

照明用語を追加推奨:"volumetric lighting", "cinematic lighting"

!

描写はできるだけ具体的に(シーン、ポーズ、材質)。

関連リソース