SDXL Turboは1ステップで画像出力を合成し、リアルタイムでテキストから画像を生成します。SDXL Turboの品質は比較的良好ですが、常に安定しているとは限りません。結果を改善するために、より高品質な結果を求める人のために、顔復元モデルとアップスケールモデルを組み込んでいます。
SDXL Turboは、テキストプロンプトを写実的な画像に効率的に変換する生成テキストから画像へのモデルで、わずか1つのネットワーク評価で実現します。Stability AIが開発したAdversarial Diffusion Distillation(ADD)と呼ばれる手法を活用し、画像合成プロセスを従来の50ステップから1〜4ステップに大幅に短縮します。SDXL 1.0からの進化であるこのモデルは、ADDを用いてスコア蒸留と敵対的損失を融合し、既存の画像拡散モデルを最適化して、より少ないサンプリングステップで高品質を実現します。この蒸留手法の導入により、画像品質を維持しつつ、画像生成に必要な計算量を大幅に削減できます。
高度な機能にもかかわらず、SDXL Turboにはいくつかの制限があります。画像を512x512ピクセルの固定解像度で生成し、読みやすいテキストのレンダリング、顔や人物の正確な描写、完全な写実性の達成に苦労する場合があります。これらの制約は、このモデルが現実世界のエンティティを事実として、または正確に表現することを意図したものではなく、研究と探索のために使用されることを強調しています。
© 著作権 2024 RunComfy. All Rights Reserved.