SDXL Turbo는 단일 단계에서 이미지 출력을 합성하고 실시간 텍스트 투 이미지 출력을 생성합니다. SDXL Turbo의 품질은 상대적으로 우수하지만 항상 안정적이지는 않을 수 있습니다. 결과를 향상시키기 위해 고품질 결과를 원하는 사람들을 위해 얼굴 복원 모델과 업스케일 모델을 통합하는 것이 좋습니다.
SDXL Turbo는 텍스트 프롬프트를 단 한 번의 네트워크 평가로 사실적인 이미지로 효율적으로 변환하는 생성적 텍스트 투 이미지 모델입니다. Stability AI에서 개발한 Adversarial Diffusion Distillation(ADD) 기술을 활용하여 이미지 합성 프로세스를 기존 모델에서 필요했던 50단계에서 1-4단계로 크게 단축시킵니다. SDXL 1.0에서 발전한 이 모델은 ADD를 사용하여 스코어 증류와 적대적 손실을 결합하여 더 적은 샘플링 단계로 더 높은 품질을 위해 기존 이미지 확산 모델의 사용을 최적화합니다. 이 증류 기술의 도입은 이미지 품질을 유지할 뿐만 아니라 이미지 생성에 필요한 계산 노력을 크게 줄입니다.
고급 기능에도 불구하고 SDXL Turbo에는 특정 제한 사항이 있습니다. 512x512 픽셀의 고정 해상도로 이미지를 생성하며 읽을 수 있는 텍스트 렌더링, 얼굴과 사람을 정확하게 묘사하기, 완벽한 사실성 달성 등에 어려움을 겪을 수 있습니다. 이러한 제약은 실제 개체의 사실적이거나 정확한 표현이 아닌 연구와 탐색을 위한 모델의 의도된 사용을 강조합니다.
© 저작권 2024 RunComfy. All Rights Reserved.