SDXL Turbo mensintesis keluaran gambar dalam satu langkah dan menghasilkan keluaran teks-ke-gambar secara real-time. Kualitas SDXL Turbo cukup baik, meskipun mungkin tidak selalu stabil. Untuk meningkatkan hasil, menggabungkan model pemulihan wajah dan model peningkatan resolusi bagi mereka yang menginginkan hasil berkualitas lebih tinggi.
SDXL Turbo adalah model teks-ke-gambar generatif yang secara efisien mengubah petunjuk teks menjadi gambar fotorealistik hanya dalam satu evaluasi jaringan. Memanfaatkan teknik yang disebut Adversarial Diffusion Distillation (ADD), yang dikembangkan oleh Stability AI, teknik ini secara drastis mempersingkat proses sintesis gambar menjadi 1 hingga 4 langkah—jauh lebih sedikit daripada 50 langkah yang dibutuhkan oleh model sebelumnya. Model ini, sebagai peningkatan dari SDXL 1.0, memanfaatkan ADD untuk menggabungkan distilasi skor dengan kehilangan adversarial, mengoptimalkan penggunaan model difusi gambar yang ada untuk kualitas lebih tinggi dengan lebih sedikit langkah sampling. Pengenalan teknik distilasi ini tidak hanya mempertahankan kualitas gambar tetapi juga secara signifikan mengurangi upaya komputasi yang diperlukan untuk pembuatan gambar.
Meskipun memiliki kemampuan canggih, SDXL Turbo memiliki beberapa keterbatasan. Ia menghasilkan gambar dengan resolusi tetap 512x512 piksel dan mungkin kesulitan dalam merender teks yang terbaca, menggambarkan wajah dan orang dengan akurat, serta mencapai fotorealisme sempurna. Keterbatasan ini menekankan penggunaan model untuk penelitian dan eksplorasi daripada representasi faktual atau akurat dari entitas dunia nyata.
© Hak Cipta 2024 RunComfy. Seluruh Hak Cipta Dilindungi.