PhotoMakerV2 Nedir
PhotoMakerV2, PhotoMaker'ın bir yükseltmesidir ve kişiselleştirilmiş metinden-görüntüye oluşturma için verimli bir yöntem sunar. Birkaç kimlik görüntüsü ve bir metin istemi kullanarak bireylerin gerçekçi fotoğraflarını sentezler.
PhotoMakerV2'nin bazı önemli özellikleri şunlardır:
- Yüksek verimlilik: Kişiselleştirilmiş fotoğrafları hızlı bir şekilde oluşturur.
- Mükemmel kimlik korunumu: Giriş kimliklerinin benzerliğini korur.
- Esnek metin kontrolü: İstemde bağlam, stil, öznitelikler vb. belirlemesine izin verir.
- Geliştirilmiş kimlik sadakati: PhotoMaker V1'e kıyasla geliştirilmiş.
PhotoMakerV2, bir kişiyi çeşitli bağlamlarda fotogerçekçi görüntüler oluşturur, görünümleri stilize eder, yaş ve cinsiyet gibi öznitelikleri değiştirir, kimlikleri birleştirir ve eski fotoğraflardan veya sanat eserlerinden insanları modernize eder. Sayısız yaratıcı olanakları açar.
PhotoMakerV2 Nasıl Çalışır
PhotoMakerV2, bir veya daha fazla kimlik görüntüsünü "stacked ID embedding" içine kodlayarak kimlik bilgisini kapsayan birleşik bir temsil oluşturur.
Bu gömü, bir metin istemi ile birleştirilir ve bir metinden-görüntüye difüzyon modeline beslenir. Model daha sonra istemde açıklanan bağlamda gömülü kimliği tasvir eden bir görüntü üretir.
Nasıl çalıştığına dair bazı önemli noktalar:
- Giriş yüz görüntülerinden kimlik bilgilerini çıkarmak için bir kimlik kodlayıcı kullanır
- Harici bir yüz tanıma modeli (InsightFace) kullanarak kimlik korunmasını iyileştirir
- Kimliği kapsamlı bir şekilde yakalamak için birden fazla kimlik görüntüsünü bir stacked embedding içine kodlar
- Stacked ID embedding'i difüzyon modelinin cross-attention katmanlarına besler
- Kimlik bilgisini adaptif olarak birleştirirken metin istemi ile oluşturmayı yönlendirir
- Kimlik yeteneklerini geliştirmek için kimlik odaklı bir veri seti ile eğitilmiştir
ComfyUI PhotoMakerV2 Nasıl Kullanılır
ComfyUI'de PhotoMakerV2 kullanmak için öncelikle PhotoMakerEncodePlus düğümü ile etkileşimde bulunun. Tipik bir iş akışı şunları içerir:
- "PhotoMaker Loader Plus" düğümünü kullanarak PhotoMakerV2 modelini yükleyin.
- "Prepare Images For CLIP Vision" düğümünü kullanarak bir veya daha fazla kimlik görüntüsü yükleyin.
- PhotoMakerV2 tarafından gereken InsightFace modelini "PhotoMaker InsightFace Loader" düğümünü kullanarak yükleyin.
- Bu düğümlerin çıktılarının "PhotoMaker Encode Plus" düğümünün ilgili girişlerine bağlayın.
- "PhotoMaker Encode Plus" düğümünde, istenen görüntüyü tanımlayan istemi belirtin. Kimliğin görünmesi gereken yerde özel tetikleyici kelimeyi kullanın.
- Görüntüyü oluşturmak için "PhotoMaker Encode Plus" düğümünden bir "KSampler" düğümüne çıkış koşullandırmasını bağlayın.
Daha fazla bilgi için lütfen ve adreslerini ziyaret edin. Tüm kredi katkılarına aittir.